End of training

Files changed (2) hide show

runs/Mar01_15-17-11_Agatas-MacBook-Pro.local/events.out.tfevents.1677680237.Agatas-MacBook-Pro.local.35252.2 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c67068337a66b39d8540e6d6bb0dd7eae024b0eff29c515cef5f7e071346d4a3
-size 5349

 version https://git-lfs.github.com/spec/v1
+oid sha256:b64e9e952743a801af12e09c88fc07511330ff69222a97792b6f541e8e57d6e1
+size 5703

trainer_state.json CHANGED Viewed

@@ -9,40 +9,40 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "learning_rate": 5e-05,
-      "loss": 6.9121,
       "step": 94
     },
     {
       "epoch": 1.0,
-      "eval_loss": 4.612173557281494,
-      "eval_runtime": 71.058,
-      "eval_samples_per_second": 2.815,
-      "eval_steps_per_second": 0.352,
       "step": 94
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0,
-      "loss": 5.9062,
       "step": 188
     },
     {
       "epoch": 2.0,
-      "eval_loss": 4.612091541290283,
-      "eval_runtime": 71.351,
-      "eval_samples_per_second": 2.803,
-      "eval_steps_per_second": 0.35,
       "step": 188
     },
     {
       "epoch": 2.0,
       "step": 188,
       "total_flos": 6.168280896e+17,
-      "train_loss": 6.409146572681183,
-      "train_runtime": 1163.2401,
-      "train_samples_per_second": 1.29,
-      "train_steps_per_second": 0.162
     }
   ],
   "max_steps": 188,

   "log_history": [
     {
       "epoch": 1.0,
+      "learning_rate": 0.0005,
+      "loss": 5.9448,
       "step": 94
     },
     {
       "epoch": 1.0,
+      "eval_loss": 4.646627902984619,
+      "eval_runtime": 70.2506,
+      "eval_samples_per_second": 2.847,
+      "eval_steps_per_second": 0.356,
       "step": 94
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0,
+      "loss": 4.6291,
       "step": 188
     },
     {
       "epoch": 2.0,
+      "eval_loss": 4.621755123138428,
+      "eval_runtime": 70.6527,
+      "eval_samples_per_second": 2.831,
+      "eval_steps_per_second": 0.354,
       "step": 188
     },
     {
       "epoch": 2.0,
       "step": 188,
       "total_flos": 6.168280896e+17,
+      "train_loss": 5.2869415283203125,
+      "train_runtime": 1145.3249,
+      "train_samples_per_second": 1.31,
+      "train_steps_per_second": 0.164
     }
   ],
   "max_steps": 188,