Model save

Files changed (8) hide show

all_results.json CHANGED Viewed

@@ -1,21 +1,21 @@
 {
     "epoch": 2.0,
-    "eval_f1": 0.5005918962125724,
-    "eval_loss": 0.916015625,
-    "eval_precision": 0.5713280704919877,
-    "eval_recall": 0.49814126531372666,
-    "eval_runtime": 0.2176,
-    "eval_samples_per_second": 9193.045,
-    "eval_steps_per_second": 4.597,
-    "test_f1": 0.4748115792949177,
-    "test_loss": 0.904296875,
-    "test_precision": 0.5385619764037229,
-    "test_recall": 0.4715960243971106,
-    "test_runtime": 0.2719,
-    "test_samples_per_second": 7355.241,
-    "test_steps_per_second": 3.678,
     "train_loss": 1.836273193359375,
-    "train_runtime": 55.5777,
-    "train_samples_per_second": 575.77,
-    "train_steps_per_second": 0.288
 }

 {
     "epoch": 2.0,
+    "eval_f1": 0.12910686958067819,
+    "eval_loss": 1.8330078125,
+    "eval_precision": 0.16504066117321736,
+    "eval_recall": 0.1890018282051825,
+    "eval_runtime": 0.2281,
+    "eval_samples_per_second": 8767.11,
+    "eval_steps_per_second": 4.384,
+    "test_f1": 0.12457335796698589,
+    "test_loss": 1.833984375,
+    "test_precision": 0.16755594823291797,
+    "test_recall": 0.1749254997504109,
+    "test_runtime": 0.3141,
+    "test_samples_per_second": 6366.553,
+    "test_steps_per_second": 3.183,
     "train_loss": 1.836273193359375,
+    "train_runtime": 55.3814,
+    "train_samples_per_second": 577.811,
+    "train_steps_per_second": 0.289
 }

eval_results.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-    "epoch": 5.0,
-    "eval_f1": 0.5005918962125724,
-    "eval_loss": 0.916015625,
-    "eval_precision": 0.5713280704919877,
-    "eval_recall": 0.49814126531372666,
-    "eval_runtime": 0.2176,
-    "eval_samples_per_second": 9193.045,
-    "eval_steps_per_second": 4.597
 }

 {
+    "epoch": 2.0,
+    "eval_f1": 0.12910686958067819,
+    "eval_loss": 1.8330078125,
+    "eval_precision": 0.16504066117321736,
+    "eval_recall": 0.1890018282051825,
+    "eval_runtime": 0.2281,
+    "eval_samples_per_second": 8767.11,
+    "eval_steps_per_second": 4.384
 }

runs/Dec31_23-40-45_hn-fornix-testing-gpu-platform-2/events.out.tfevents.1735688523.hn-fornix-testing-gpu-platform-2.1028595.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:82f51daf4ecc2397b6b606e478b1fd1796bad352a2636ce7fda6a54ee2b8b2ab
+size 500

runs/Dec31_23-47-53_hn-fornix-testing-gpu-platform-2/events.out.tfevents.1735688888.hn-fornix-testing-gpu-platform-2.1030578.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fad170bb4e5fc427e08dba614e7eb018daf49b93053ec3cf3f8b2b5128e745fc
+size 7818

test_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "test_f1": 0.4748115792949177,
-    "test_loss": 0.904296875,
-    "test_precision": 0.5385619764037229,
-    "test_recall": 0.4715960243971106,
-    "test_runtime": 0.2719,
-    "test_samples_per_second": 7355.241,
-    "test_steps_per_second": 3.678
 }

 {
+    "test_f1": 0.12457335796698589,
+    "test_loss": 1.833984375,
+    "test_precision": 0.16755594823291797,
+    "test_recall": 0.1749254997504109,
+    "test_runtime": 0.3141,
+    "test_samples_per_second": 6366.553,
+    "test_steps_per_second": 3.183
 }

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 2.0,
     "train_loss": 1.836273193359375,
-    "train_runtime": 55.5777,
-    "train_samples_per_second": 575.77,
-    "train_steps_per_second": 0.288
 }

 {
     "epoch": 2.0,
     "train_loss": 1.836273193359375,
+    "train_runtime": 55.3814,
+    "train_samples_per_second": 577.811,
+    "train_steps_per_second": 0.289
 }

trainer_state.json CHANGED Viewed

@@ -21,9 +21,9 @@
       "eval_loss": 1.8330078125,
       "eval_precision": 0.16504066117321736,
       "eval_recall": 0.1890018282051825,
-      "eval_runtime": 8.3613,
-      "eval_samples_per_second": 239.198,
-      "eval_steps_per_second": 0.12,
       "step": 8
     },
     {
@@ -46,9 +46,9 @@
       "eval_loss": 1.8330078125,
       "eval_precision": 0.16504066117321736,
       "eval_recall": 0.1890018282051825,
-      "eval_runtime": 0.2784,
-      "eval_samples_per_second": 7185.079,
-      "eval_steps_per_second": 3.593,
       "step": 16
     },
     {
@@ -56,9 +56,9 @@
       "step": 16,
       "total_flos": 1489153141243904.0,
       "train_loss": 1.836273193359375,
-      "train_runtime": 55.5777,
-      "train_samples_per_second": 575.77,
-      "train_steps_per_second": 0.288
     }
   ],
   "logging_steps": 5,

       "eval_loss": 1.8330078125,
       "eval_precision": 0.16504066117321736,
       "eval_recall": 0.1890018282051825,
+      "eval_runtime": 8.5241,
+      "eval_samples_per_second": 234.629,
+      "eval_steps_per_second": 0.117,
       "step": 8
     },
     {
       "eval_loss": 1.8330078125,
       "eval_precision": 0.16504066117321736,
       "eval_recall": 0.1890018282051825,
+      "eval_runtime": 0.2771,
+      "eval_samples_per_second": 7218.143,
+      "eval_steps_per_second": 3.609,
       "step": 16
     },
     {
       "step": 16,
       "total_flos": 1489153141243904.0,
       "train_loss": 1.836273193359375,
+      "train_runtime": 55.3814,
+      "train_samples_per_second": 577.811,
+      "train_steps_per_second": 0.289
     }
   ],
   "logging_steps": 5,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08a6db26aa828f8aaa4584fae5d1093d17efc4ea8cacf4d69a3e81a485e07bb0
 size 6840

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3eca857a5e7424f30d3c72eb902866ef8a6aa76cff072375554179622676a32
 size 6840