codelion
/

dhara-250m-ar-base

@@ -10,6 +10,9 @@ tags:
 - language-model
 - canon-layers
 - rope-yarn
 library_name: transformers
 pipeline_tag: text-generation
 ---
@@ -139,8 +142,9 @@ Evaluated using [lm-evaluation-harness](https://github.com/EleutherAI/lm-evaluat
 | ARC-Challenge | 26.62% | 25.51% | -1.11 |
 | MMLU (5-shot) | 22.95% | 22.95% | 0.00 |
 | SciQ | 22.00% | 21.30% | -0.70 |
-Context extension to 32K preserved short-context benchmark performance with negligible change (average delta < 0.5%).
 ## Context Extension Results

 - language-model
 - canon-layers
 - rope-yarn
+datasets:
+- codelion/sutra-10B
+- allenai/dolma3_longmino_mix-50B-1025
 library_name: transformers
 pipeline_tag: text-generation
 ---
 | ARC-Challenge | 26.62% | 25.51% | -1.11 |
 | MMLU (5-shot) | 22.95% | 22.95% | 0.00 |
 | SciQ | 22.00% | 21.30% | -0.70 |
+| **Average** | **35.56%** | **35.62%** | **+0.06** |
+Context extension to 32K preserved short-context benchmark performance with negligible change.
 ## Context Extension Results