Training in progress, step 6000

Browse files

Files changed (10) hide show

{checkpoint-3000 → checkpoint-6000}/config.json +0 -0
{checkpoint-3000 → checkpoint-6000}/optimizer.pt +1 -1
{checkpoint-3000 → checkpoint-6000}/preprocessor_config.json +0 -0
{checkpoint-3000 → checkpoint-6000}/pytorch_model.bin +1 -1
{checkpoint-3000 → checkpoint-6000}/rng_state.pth +1 -1
{checkpoint-3000 → checkpoint-6000}/scaler.pt +1 -1
{checkpoint-3000 → checkpoint-6000}/scheduler.pt +1 -1
{checkpoint-3000 → checkpoint-6000}/trainer_state.json +210 -3
{checkpoint-3000 → checkpoint-6000}/training_args.bin +0 -0
pytorch_model.bin +1 -1

{checkpoint-3000 → checkpoint-6000}/config.json RENAMED Viewed

File without changes

{checkpoint-3000 → checkpoint-6000}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:94450a47c3ca62b991db9a57550d81b8cd90698ed4ef2543b783aa61e5c1766d
 size 2490337809

 version https://git-lfs.github.com/spec/v1
+oid sha256:57a02e3f0c79bd1e97834af9735ae9ea2c51e986a0e4aebe78745ac090bd29bf
 size 2490337809

{checkpoint-3000 → checkpoint-6000}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-3000 → checkpoint-6000}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:327bed48381999df4748f541a4a9fa0c348c7ae5d4e4f883c614432b3a8395bd
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:c14c1a98519a72a2d3a4339ab78f6a4b41d391852271790078767a444fe87beb
 size 1262063089

{checkpoint-3000 → checkpoint-6000}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f80481468e633ed17f4d3b953b5bfd7af41f1fc73703fdad42f6fc3bad5c020f
 size 14567

 version https://git-lfs.github.com/spec/v1
+oid sha256:7855b43fb50533e2e01cf47c566be51da5a7cd11b3be55d9d7c0c79407094c18
 size 14567

{checkpoint-3000 → checkpoint-6000}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:05430fc7d2676bfa8c337884b4956f58b83fbf1ce211afb4952306653777fc6c
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:d156164b5a9269c6c2ad987484964bc9fa0a7b461cee526f820c65c9c09e374a
 size 559

{checkpoint-3000 → checkpoint-6000}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14f025f6209560d43d4588b308395c8f0162d863f3099cf81ce8917d61699085
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:48b52dcc81c772638b05def04e150569a1ebe5930008f73931aa734959b1a983
 size 623

{checkpoint-3000 → checkpoint-6000}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 31.24935064935065,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -213,11 +213,218 @@
       "eval_steps_per_second": 0.795,
       "eval_wer": 0.1388858784003468,
       "step": 3000
     }
   ],
   "max_steps": 9600,
   "num_train_epochs": 100,
-  "total_flos": 4.660374091191037e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 62.4987012987013,
+  "global_step": 6000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.795,
       "eval_wer": 0.1388858784003468,
       "step": 3000
+    },
+    {
+      "epoch": 32.29,
+      "learning_rate": 6.3505859375e-05,
+      "loss": 0.9285,
+      "step": 3100
+    },
+    {
+      "epoch": 33.33,
+      "learning_rate": 6.252929687499999e-05,
+      "loss": 0.9121,
+      "step": 3200
+    },
+    {
+      "epoch": 34.37,
+      "learning_rate": 6.155273437499999e-05,
+      "loss": 0.9016,
+      "step": 3300
+    },
+    {
+      "epoch": 35.42,
+      "learning_rate": 6.0576171875e-05,
+      "loss": 0.9023,
+      "step": 3400
+    },
+    {
+      "epoch": 36.46,
+      "learning_rate": 5.9599609374999994e-05,
+      "loss": 0.9004,
+      "step": 3500
+    },
+    {
+      "epoch": 37.5,
+      "learning_rate": 5.862304687499999e-05,
+      "loss": 0.8844,
+      "step": 3600
+    },
+    {
+      "epoch": 38.54,
+      "learning_rate": 5.7646484375e-05,
+      "loss": 0.8771,
+      "step": 3700
+    },
+    {
+      "epoch": 39.58,
+      "learning_rate": 5.6669921875e-05,
+      "loss": 0.876,
+      "step": 3800
+    },
+    {
+      "epoch": 40.62,
+      "learning_rate": 5.569335937499999e-05,
+      "loss": 0.8708,
+      "step": 3900
+    },
+    {
+      "epoch": 41.66,
+      "learning_rate": 5.4716796874999997e-05,
+      "loss": 0.8691,
+      "step": 4000
+    },
+    {
+      "epoch": 41.66,
+      "eval_loss": 0.14571049809455872,
+      "eval_runtime": 195.237,
+      "eval_samples_per_second": 25.84,
+      "eval_steps_per_second": 0.809,
+      "eval_wer": 0.12899642353961202,
+      "step": 4000
+    },
+    {
+      "epoch": 42.71,
+      "learning_rate": 5.3740234374999996e-05,
+      "loss": 0.8624,
+      "step": 4100
+    },
+    {
+      "epoch": 43.75,
+      "learning_rate": 5.2763671874999995e-05,
+      "loss": 0.8556,
+      "step": 4200
+    },
+    {
+      "epoch": 44.79,
+      "learning_rate": 5.1787109375e-05,
+      "loss": 0.8607,
+      "step": 4300
+    },
+    {
+      "epoch": 45.83,
+      "learning_rate": 5.0810546875e-05,
+      "loss": 0.8536,
+      "step": 4400
+    },
+    {
+      "epoch": 46.87,
+      "learning_rate": 4.983398437499999e-05,
+      "loss": 0.8493,
+      "step": 4500
+    },
+    {
+      "epoch": 47.91,
+      "learning_rate": 4.8857421875e-05,
+      "loss": 0.8456,
+      "step": 4600
+    },
+    {
+      "epoch": 48.96,
+      "learning_rate": 4.7880859375e-05,
+      "loss": 0.8333,
+      "step": 4700
+    },
+    {
+      "epoch": 50.0,
+      "learning_rate": 4.6904296874999996e-05,
+      "loss": 0.8346,
+      "step": 4800
+    },
+    {
+      "epoch": 51.04,
+      "learning_rate": 4.5927734375e-05,
+      "loss": 0.8403,
+      "step": 4900
+    },
+    {
+      "epoch": 52.08,
+      "learning_rate": 4.4951171874999995e-05,
+      "loss": 0.8328,
+      "step": 5000
+    },
+    {
+      "epoch": 52.08,
+      "eval_loss": 0.14348936080932617,
+      "eval_runtime": 197.7739,
+      "eval_samples_per_second": 25.509,
+      "eval_steps_per_second": 0.799,
+      "eval_wer": 0.12054297171344966,
+      "step": 5000
+    },
+    {
+      "epoch": 53.12,
+      "learning_rate": 4.3974609374999994e-05,
+      "loss": 0.8275,
+      "step": 5100
+    },
+    {
+      "epoch": 54.17,
+      "learning_rate": 4.2998046875e-05,
+      "loss": 0.8262,
+      "step": 5200
+    },
+    {
+      "epoch": 55.21,
+      "learning_rate": 4.2021484375e-05,
+      "loss": 0.8167,
+      "step": 5300
+    },
+    {
+      "epoch": 56.25,
+      "learning_rate": 4.1044921875e-05,
+      "loss": 0.8194,
+      "step": 5400
+    },
+    {
+      "epoch": 57.29,
+      "learning_rate": 4.0068359375e-05,
+      "loss": 0.8192,
+      "step": 5500
+    },
+    {
+      "epoch": 58.33,
+      "learning_rate": 3.9091796874999996e-05,
+      "loss": 0.8176,
+      "step": 5600
+    },
+    {
+      "epoch": 59.37,
+      "learning_rate": 3.8115234374999995e-05,
+      "loss": 0.8115,
+      "step": 5700
+    },
+    {
+      "epoch": 60.42,
+      "learning_rate": 3.7138671874999994e-05,
+      "loss": 0.8129,
+      "step": 5800
+    },
+    {
+      "epoch": 61.46,
+      "learning_rate": 3.6162109375e-05,
+      "loss": 0.8052,
+      "step": 5900
+    },
+    {
+      "epoch": 62.5,
+      "learning_rate": 3.518554687499999e-05,
+      "loss": 0.8068,
+      "step": 6000
+    },
+    {
+      "epoch": 62.5,
+      "eval_loss": 0.13501569628715515,
+      "eval_runtime": 207.5786,
+      "eval_samples_per_second": 24.304,
+      "eval_steps_per_second": 0.761,
+      "eval_wer": 0.11913406307575593,
+      "step": 6000
     }
   ],
   "max_steps": 9600,
   "num_train_epochs": 100,
+  "total_flos": 9.319334032985827e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-3000 → checkpoint-6000}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fa6cf3410bd0459e255908bdf44aa100963a7896b62986289a4263c9bba0a128
 size 1262063089

 version https://git-lfs.github.com/spec/v1
+oid sha256:c14c1a98519a72a2d3a4339ab78f6a4b41d391852271790078767a444fe87beb
 size 1262063089