Training in progress, step 10500

Files changed (7) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf4919861d4ccad97fae1071067d911686e64c5cc77f484bfa4b5cec4d30e90e
 size 484083951

 version https://git-lfs.github.com/spec/v1
+oid sha256:1a404583ef80bf3b8c4a510d27f887ac8e29f3411663bf49b4ab7232ce9a412a
 size 484083951

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:54b61cd064030bd425900beed8f1b2f0d1bc9425a31138817e896147af0cff57
 size 242031355

 version https://git-lfs.github.com/spec/v1
+oid sha256:8cf45d731900f7f9e07949ef1dfe708b522e158b7cfbb371287593175d5efcd1
 size 242031355

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6c2aff395de1e042f420e44ce149e165cdd8e788140e8479c307cc0e81bd4492
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:a00f35a9c679472118eaa7dabfb186e79026b1432f53b64dfdf5c3e63bbd9480
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f31e111ce45b24bb4dd00df4effa8ae11169116c6b61584f2128dd8c7b4467db
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:1c3bf52f39b4d9c5882704c54922db0ba799f5f2afb01fd986c87b5fde9ed4b4
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:697eba7592480ffb0e189ee34a39a2f526ba9f89c84a69e8fbca7dd532b29056
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:bfb31fa41ab4193878df5129dfbe7781af2d43ca089016d1833b7ff3a9dc1ee5
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 0.7238326668739319,
-  "best_model_checkpoint": "/home2/s5431786/jb-internship/results/t5-small-CodeXGLUE-CONCODE-faster/checkpoint-10000",
-  "epoch": 3.2,
-  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -386,11 +386,30 @@
       "eval_samples_per_second": 57.0,
       "eval_steps_per_second": 1.795,
       "step": 10000
     }
   ],
   "max_steps": 62500,
   "num_train_epochs": 20,
-  "total_flos": 4.184333715977011e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.715421736240387,
+  "best_model_checkpoint": "/home2/s5431786/jb-internship/results/t5-small-CodeXGLUE-CONCODE-faster/checkpoint-10500",
+  "epoch": 3.36,
+  "global_step": 10500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 57.0,
       "eval_steps_per_second": 1.795,
       "step": 10000
+    },
+    {
+      "epoch": 3.36,
+      "learning_rate": 0.00043792,
+      "loss": 0.5708,
+      "step": 10500
+    },
+    {
+      "epoch": 3.36,
+      "eval_bleu": 0.06631228557498069,
+      "eval_exact_match": 0.0995,
+      "eval_loss": 0.715421736240387,
+      "eval_rouge1": 0.5068028046779569,
+      "eval_rouge2": 0.34473925417295426,
+      "eval_rougeL": 0.49254925133943384,
+      "eval_runtime": 35.4516,
+      "eval_samples_per_second": 56.415,
+      "eval_steps_per_second": 1.777,
+      "step": 10500
     }
   ],
   "max_steps": 62500,
   "num_train_epochs": 20,
+  "total_flos": 4.393192338122342e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:54b61cd064030bd425900beed8f1b2f0d1bc9425a31138817e896147af0cff57
 size 242031355

 version https://git-lfs.github.com/spec/v1
+oid sha256:8cf45d731900f7f9e07949ef1dfe708b522e158b7cfbb371287593175d5efcd1
 size 242031355