marinone94 commited on Feb 3, 2022

Commit

33fa953

•

1 Parent(s): bbba84f

sync

Browse files

Files changed (19) hide show

{checkpoint-100 → checkpoint-300}/config.json +0 -0
{checkpoint-100 → checkpoint-300}/optimizer.pt +2 -2
{checkpoint-100 → checkpoint-300}/preprocessor_config.json +0 -0
{checkpoint-50 → checkpoint-300}/pytorch_model.bin +1 -1
{checkpoint-50 → checkpoint-300}/rng_state.pth +1 -1
{checkpoint-50 → checkpoint-300}/scaler.pt +1 -1
{checkpoint-100 → checkpoint-300}/scheduler.pt +1 -1
{checkpoint-100 → checkpoint-300}/trainer_state.json +99 -3
{checkpoint-100 → checkpoint-300}/training_args.bin +0 -0
{checkpoint-50 → checkpoint-350}/config.json +0 -0
{checkpoint-50 → checkpoint-350}/optimizer.pt +2 -2
{checkpoint-50 → checkpoint-350}/preprocessor_config.json +0 -0
{checkpoint-100 → checkpoint-350}/pytorch_model.bin +1 -1
{checkpoint-100 → checkpoint-350}/rng_state.pth +1 -1
{checkpoint-100 → checkpoint-350}/scaler.pt +1 -1
{checkpoint-50 → checkpoint-350}/scheduler.pt +1 -1
checkpoint-350/trainer_state.json +181 -0
{checkpoint-50 → checkpoint-350}/training_args.bin +0 -0
checkpoint-50/trainer_state.json +0 -37

{checkpoint-100 → checkpoint-300}/config.json RENAMED Viewed

File without changes

{checkpoint-100 → checkpoint-300}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a37fc39f7fbbd9e4e27f32438be5a7defea135497c5dd3778613d2e5336ad19
-size 2490337361

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ae9e41884d3305d9a0797fd14fd35fc8e619e12951eedb6e1396e3ead551313
+size 2490337809

{checkpoint-100 → checkpoint-300}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-50 → checkpoint-300}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80ebb6ebc7a95b13fda5cdc22fab5fcfb9ffdb99ca0102065a7147116a7f9f3f
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:4ba896f27a39cdc0a9c70e56aeff43d05c53ba85e3a65d2c02f13edcce3b7ac8
 size 1262063089

{checkpoint-50 → checkpoint-300}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2fe8f634109af89a7e3706d16f2fb93f152eb68502ebee688d78216511e43324
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:7dad8817bedcf4b45f9a2d36af4404126640a18d28d8189d505ec2ab56d4b6a1
 size 14503

{checkpoint-50 → checkpoint-300}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83a7ca717969781e5bd7f66c4b808307bbfaef76d5ae72d82fe31d60dea27fb7
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:0967b9f865f16344c55f5ccc3cf7d6e8e97ca61dda304e931ca6bad130f48dd1
 size 559

{checkpoint-100 → checkpoint-300}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:48ba5c556f6ae479cce41c7f298c01a0d3452634d5c926dc7e48294e0c69c304
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:303fe9412b2bbace437d42323a895571355b0ae20c611a474d9492be12287f9c
 size 623

{checkpoint-100 → checkpoint-300}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.281150159744409,
-  "global_step": 100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -54,11 +54,107 @@
       "eval_steps_per_second": 1.239,
       "eval_wer": 1.0,
       "step": 100
     }
   ],
   "max_steps": 780,
   "num_train_epochs": 10,
-  "total_flos": 1.5267594688539034e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.8434504792332267,
+  "global_step": 300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 1.239,
       "eval_wer": 1.0,
       "step": 100
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 0.0006346153846153846,
+      "loss": 3.0159,
+      "step": 120
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 0.0006153846153846154,
+      "loss": 2.977,
+      "step": 140
+    },
+    {
+      "epoch": 1.92,
+      "eval_loss": 2.973355770111084,
+      "eval_runtime": 3.1716,
+      "eval_samples_per_second": 31.53,
+      "eval_steps_per_second": 1.261,
+      "eval_wer": 1.0,
+      "step": 150
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 0.0005961538461538461,
+      "loss": 3.0056,
+      "step": 160
+    },
+    {
+      "epoch": 2.31,
+      "learning_rate": 0.000576923076923077,
+      "loss": 2.9591,
+      "step": 180
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 0.0005576923076923078,
+      "loss": 2.9398,
+      "step": 200
+    },
+    {
+      "epoch": 2.56,
+      "eval_loss": 2.940675735473633,
+      "eval_runtime": 3.1691,
+      "eval_samples_per_second": 31.554,
+      "eval_steps_per_second": 1.262,
+      "eval_wer": 1.0,
+      "step": 200
+    },
+    {
+      "epoch": 2.82,
+      "learning_rate": 0.0005384615384615384,
+      "loss": 2.9295,
+      "step": 220
+    },
+    {
+      "epoch": 3.08,
+      "learning_rate": 0.0005192307692307692,
+      "loss": 2.9465,
+      "step": 240
+    },
+    {
+      "epoch": 3.2,
+      "eval_loss": 2.835913896560669,
+      "eval_runtime": 3.1824,
+      "eval_samples_per_second": 31.423,
+      "eval_steps_per_second": 1.257,
+      "eval_wer": 1.0,
+      "step": 250
+    },
+    {
+      "epoch": 3.33,
+      "learning_rate": 0.0005,
+      "loss": 2.9053,
+      "step": 260
+    },
+    {
+      "epoch": 3.59,
+      "learning_rate": 0.0004807692307692308,
+      "loss": 2.899,
+      "step": 280
+    },
+    {
+      "epoch": 3.84,
+      "learning_rate": 0.0004615384615384616,
+      "loss": 2.8861,
+      "step": 300
+    },
+    {
+      "epoch": 3.84,
+      "eval_loss": 2.8373122215270996,
+      "eval_runtime": 3.1455,
+      "eval_samples_per_second": 31.791,
+      "eval_steps_per_second": 1.272,
+      "eval_wer": 1.0,
+      "step": 300
     }
   ],
   "max_steps": 780,
   "num_train_epochs": 10,
+  "total_flos": 4.5237874175174973e+18,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-100 → checkpoint-300}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-50 → checkpoint-350}/config.json RENAMED Viewed

File without changes

{checkpoint-50 → checkpoint-350}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4f8c3352ebf31a7c0483167400d3399b22ccc2be15a1cf307f0d154c758e9499
-size 2490337361

 version https://git-lfs.github.com/spec/v1
+oid sha256:73ac1e891bd6525ca6e80b6eb98bd75676f15de9c2c7ed28a04409bd578ec0e5
+size 2490337809

{checkpoint-50 → checkpoint-350}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-100 → checkpoint-350}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b71ffcd1b91ea379737ddde0779f635b716bdd28dd2319a1848a317ef50fd710
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:9143d1cdbe52a5a78c256f6c9739fca212258b1e2cd7f7a50eac95314a70e3a3
 size 1262063089

{checkpoint-100 → checkpoint-350}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0b19e6c7c1493b5479a5fdad58d60d11a146aedd47536529f399dc05f5b158e
 size 14567

 version https://git-lfs.github.com/spec/v1
+oid sha256:e73f3035f0a34c54cee6bdff78f510ce1bacc7a1d34681e6733f0c9a19ff6280
 size 14567

{checkpoint-100 → checkpoint-350}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:13a3423b2fe42f204bc8fe2c666ff379f9fd753a0f13613064a5e71e86b519e8
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:416c647a9555a5cdcb63e21cfbb531c48e435b4c488666f2c461c0870bce7d8f
 size 559

{checkpoint-50 → checkpoint-350}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fb5336e922700acd511fdefd5fbbe9ccf91f59901dbca8c97f53c0892943c4b7
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:55a5628618be5d495f517856cf6ffc4824491879e5d2a0c2d74458d24b484021
 size 623

checkpoint-350/trainer_state.json ADDED Viewed

	@@ -0,0 +1,181 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.485623003194888,
+  "global_step": 350,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.0007307692307692308,
+      "loss": 4.2559,
+      "step": 20
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.0007115384615384615,
+      "loss": 3.068,
+      "step": 40
+    },
+    {
+      "epoch": 0.64,
+      "eval_loss": 3.058549165725708,
+      "eval_runtime": 3.3353,
+      "eval_samples_per_second": 29.982,
+      "eval_steps_per_second": 1.199,
+      "eval_wer": 1.0,
+      "step": 50
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 0.0006923076923076924,
+      "loss": 3.0637,
+      "step": 60
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 0.0006730769230769232,
+      "loss": 3.0752,
+      "step": 80
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 0.0006538461538461538,
+      "loss": 3.0083,
+      "step": 100
+    },
+    {
+      "epoch": 1.28,
+      "eval_loss": 3.1246652603149414,
+      "eval_runtime": 3.2285,
+      "eval_samples_per_second": 30.974,
+      "eval_steps_per_second": 1.239,
+      "eval_wer": 1.0,
+      "step": 100
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 0.0006346153846153846,
+      "loss": 3.0159,
+      "step": 120
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 0.0006153846153846154,
+      "loss": 2.977,
+      "step": 140
+    },
+    {
+      "epoch": 1.92,
+      "eval_loss": 2.973355770111084,
+      "eval_runtime": 3.1716,
+      "eval_samples_per_second": 31.53,
+      "eval_steps_per_second": 1.261,
+      "eval_wer": 1.0,
+      "step": 150
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 0.0005961538461538461,
+      "loss": 3.0056,
+      "step": 160
+    },
+    {
+      "epoch": 2.31,
+      "learning_rate": 0.000576923076923077,
+      "loss": 2.9591,
+      "step": 180
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 0.0005576923076923078,
+      "loss": 2.9398,
+      "step": 200
+    },
+    {
+      "epoch": 2.56,
+      "eval_loss": 2.940675735473633,
+      "eval_runtime": 3.1691,
+      "eval_samples_per_second": 31.554,
+      "eval_steps_per_second": 1.262,
+      "eval_wer": 1.0,
+      "step": 200
+    },
+    {
+      "epoch": 2.82,
+      "learning_rate": 0.0005384615384615384,
+      "loss": 2.9295,
+      "step": 220
+    },
+    {
+      "epoch": 3.08,
+      "learning_rate": 0.0005192307692307692,
+      "loss": 2.9465,
+      "step": 240
+    },
+    {
+      "epoch": 3.2,
+      "eval_loss": 2.835913896560669,
+      "eval_runtime": 3.1824,
+      "eval_samples_per_second": 31.423,
+      "eval_steps_per_second": 1.257,
+      "eval_wer": 1.0,
+      "step": 250
+    },
+    {
+      "epoch": 3.33,
+      "learning_rate": 0.0005,
+      "loss": 2.9053,
+      "step": 260
+    },
+    {
+      "epoch": 3.59,
+      "learning_rate": 0.0004807692307692308,
+      "loss": 2.899,
+      "step": 280
+    },
+    {
+      "epoch": 3.84,
+      "learning_rate": 0.0004615384615384616,
+      "loss": 2.8861,
+      "step": 300
+    },
+    {
+      "epoch": 3.84,
+      "eval_loss": 2.8373122215270996,
+      "eval_runtime": 3.1455,
+      "eval_samples_per_second": 31.791,
+      "eval_steps_per_second": 1.272,
+      "eval_wer": 1.0,
+      "step": 300
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 0.0004423076923076923,
+      "loss": 2.9255,
+      "step": 320
+    },
+    {
+      "epoch": 4.36,
+      "learning_rate": 0.0004230769230769231,
+      "loss": 2.884,
+      "step": 340
+    },
+    {
+      "epoch": 4.49,
+      "eval_loss": 2.815220832824707,
+      "eval_runtime": 3.2038,
+      "eval_samples_per_second": 31.213,
+      "eval_steps_per_second": 1.249,
+      "eval_wer": 1.0476190476190477,
+      "step": 350
+    }
+  ],
+  "max_steps": 780,
+  "num_train_epochs": 10,
+  "total_flos": 5.238613498111745e+18,
+  "trial_name": null,
+  "trial_params": null
+}

{checkpoint-50 → checkpoint-350}/training_args.bin RENAMED Viewed

File without changes

checkpoint-50/trainer_state.json DELETED Viewed

@@ -1,37 +0,0 @@
-{
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 0.6389776357827476,
-  "global_step": 50,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.26,
-      "learning_rate": 0.0007307692307692308,
-      "loss": 4.2559,
-      "step": 20
-    },
-    {
-      "epoch": 0.51,
-      "learning_rate": 0.0007115384615384615,
-      "loss": 3.068,
-      "step": 40
-    },
-    {
-      "epoch": 0.64,
-      "eval_loss": 3.058549165725708,
-      "eval_runtime": 3.3353,
-      "eval_samples_per_second": 29.982,
-      "eval_steps_per_second": 1.199,
-      "eval_wer": 1.0,
-      "step": 50
-    }
-  ],
-  "max_steps": 780,
-  "num_train_epochs": 10,
-  "total_flos": 7.755792033779712e+17,
-  "trial_name": null,
-  "trial_params": null
-}