Training completed

Files changed (3) hide show

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.0091324200913242,
     "total_flos": 6.970544231337165e+16,
-    "train_loss": 4.522793579101562,
-    "train_runtime": 135.1739,
-    "train_samples_per_second": 5.918,
-    "train_steps_per_second": 0.074
 }

 {
     "epoch": 0.0091324200913242,
     "total_flos": 6.970544231337165e+16,
+    "train_loss": 4.537882995605469,
+    "train_runtime": 129.105,
+    "train_samples_per_second": 6.197,
+    "train_steps_per_second": 0.077
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.0091324200913242,
     "total_flos": 6.970544231337165e+16,
-    "train_loss": 4.522793579101562,
-    "train_runtime": 135.1739,
-    "train_samples_per_second": 5.918,
-    "train_steps_per_second": 0.074
 }

 {
     "epoch": 0.0091324200913242,
     "total_flos": 6.970544231337165e+16,
+    "train_loss": 4.537882995605469,
+    "train_runtime": 129.105,
+    "train_samples_per_second": 6.197,
+    "train_steps_per_second": 0.077
 }

trainer_state.json CHANGED Viewed

@@ -11,19 +11,19 @@
   "log_history": [
     {
       "epoch": 0.0091324200913242,
-      "grad_norm": 2.4754679203033447,
       "learning_rate": 0.0001,
-      "loss": 4.5228,
       "step": 10
     },
     {
       "epoch": 0.0091324200913242,
       "step": 10,
       "total_flos": 6.970544231337165e+16,
-      "train_loss": 4.522793579101562,
-      "train_runtime": 135.1739,
-      "train_samples_per_second": 5.918,
-      "train_steps_per_second": 0.074
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 0.0091324200913242,
+      "grad_norm": 0.6447323560714722,
       "learning_rate": 0.0001,
+      "loss": 4.5379,
       "step": 10
     },
     {
       "epoch": 0.0091324200913242,
       "step": 10,
       "total_flos": 6.970544231337165e+16,
+      "train_loss": 4.537882995605469,
+      "train_runtime": 129.105,
+      "train_samples_per_second": 6.197,
+      "train_steps_per_second": 0.077
     }
   ],
   "logging_steps": 10,