Training in progress, step 14000

Files changed (6) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed334af45da6a372d4592aa75676cdb3e422acd36d6a0c66d955a1dbc57ab0dd
 size 1135685

 version https://git-lfs.github.com/spec/v1
+oid sha256:b67a585ad731edfd3190139c2048716d1ef0cd5c4e23c5d039753733beb85292
 size 1135685

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1021e377e391cc6947b7dce173c87b831be15e39b03af5b665c60dd6a202e167
 size 307910149

 version https://git-lfs.github.com/spec/v1
+oid sha256:593e18bc3c456f313a1af17bb6a97030aabe3dfbde4c59f3e4ae0a040049cb77
 size 307910149

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:39405895ed2653446c0043563c21dc9b8fb85a36697b5b984761ec4ca5c49cff
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:82960f07cae3e568bb93b45888fd2b6a63f1fd9b319bf6f6dda39789df0fc6a6
 size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f07e5c87a13181fdd91b70430838fde915aa2178a6a09686f68923b2683ae87
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:9a9379299cb036bee8563adb6a6941350bd1a2187d737827bca0ce7b889d9885
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 1.7180376052856445,
   "best_model_checkpoint": "/home3/s5431786/nlp-final-project/results/google-flan-t5-small-e-snli-generation-explanation_use_prompt_label-selected-b64/checkpoint-12000",
-  "epoch": 1.3979496738117427,
-  "global_step": 12000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -138,11 +138,33 @@
       "eval_samples_per_second": 61.053,
       "eval_steps_per_second": 0.955,
       "step": 12000
     }
   ],
   "max_steps": 85840,
   "num_train_epochs": 10,
-  "total_flos": 1.8127294826041344e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 1.7180376052856445,
   "best_model_checkpoint": "/home3/s5431786/nlp-final-project/results/google-flan-t5-small-e-snli-generation-explanation_use_prompt_label-selected-b64/checkpoint-12000",
+  "epoch": 1.6309412861136998,
+  "global_step": 14000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 61.053,
       "eval_steps_per_second": 0.955,
       "step": 12000
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 0.0008809535488301369,
+      "loss": 1.2527,
+      "step": 14000
+    },
+    {
+      "epoch": 1.63,
+      "eval_accuracy": null,
+      "eval_bertscore_f1": 0.9347525270301088,
+      "eval_bleu": 0.4103575347376984,
+      "eval_f1": null,
+      "eval_loss": 1.7438157796859741,
+      "eval_rouge1": 0.6163196253092696,
+      "eval_rouge2": 0.40951276436422024,
+      "eval_rougeL": 0.561512744919562,
+      "eval_rougeLsum": 0.5636171995683823,
+      "eval_runtime": 163.0281,
+      "eval_samples_per_second": 60.37,
+      "eval_steps_per_second": 0.945,
+      "step": 14000
     }
   ],
   "max_steps": 85840,
   "num_train_epochs": 10,
+  "total_flos": 2.1150083559346176e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1021e377e391cc6947b7dce173c87b831be15e39b03af5b665c60dd6a202e167
 size 307910149

 version https://git-lfs.github.com/spec/v1
+oid sha256:593e18bc3c456f313a1af17bb6a97030aabe3dfbde4c59f3e4ae0a040049cb77
 size 307910149