End of training

Browse files

Files changed (5) hide show

all_results.json +14 -0
eval_results.json +9 -0
pytorch_model.bin +1 -1
train_results.json +8 -0
trainer_state.json +283 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 10.0,
+    "eval_loss": 0.8003901243209839,
+    "eval_runtime": 244.1765,
+    "eval_samples": 4620,
+    "eval_samples_per_second": 18.921,
+    "eval_steps_per_second": 4.73,
+    "eval_wer": 0.7138530257602643,
+    "train_loss": 2.1586562755496,
+    "train_runtime": 12185.0109,
+    "train_samples": 11030,
+    "train_samples_per_second": 9.052,
+    "train_steps_per_second": 0.282
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 10.0,
+    "eval_loss": 0.8003901243209839,
+    "eval_runtime": 244.1765,
+    "eval_samples": 4620,
+    "eval_samples_per_second": 18.921,
+    "eval_steps_per_second": 4.73,
+    "eval_wer": 0.7138530257602643
+}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3bc8ce37e65f992aefce6587101ba8318ccbec2acd7f507334bd903b9cc0d341
 size 1262075377

 version https://git-lfs.github.com/spec/v1
+oid sha256:fab04453ef31717d5c79f49a9ab4367b942ff7af5783e8728af4ad4886acf678
 size 1262075377

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 10.0,
+    "train_loss": 2.1586562755496,
+    "train_runtime": 12185.0109,
+    "train_samples": 11030,
+    "train_samples_per_second": 9.052,
+    "train_steps_per_second": 0.282
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,283 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 9.997824510514866,
+  "global_step": 3440,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.29,
+      "learning_rate": 5e-05,
+      "loss": 7.294,
+      "step": 100
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 0.0001,
+      "loss": 3.2282,
+      "step": 200
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 0.00015,
+      "loss": 3.0143,
+      "step": 300
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 0.0002,
+      "loss": 2.9501,
+      "step": 400
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 0.00025,
+      "loss": 2.6683,
+      "step": 500
+    },
+    {
+      "epoch": 1.45,
+      "eval_loss": 1.7697819471359253,
+      "eval_runtime": 250.7581,
+      "eval_samples_per_second": 18.424,
+      "eval_steps_per_second": 4.606,
+      "eval_wer": 1.0040690203756961,
+      "step": 500
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 0.0003,
+      "loss": 2.1972,
+      "step": 600
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 0.00035,
+      "loss": 2.0775,
+      "step": 700
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 0.0004,
+      "loss": 1.9871,
+      "step": 800
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 0.00045000000000000004,
+      "loss": 1.9768,
+      "step": 900
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 0.0005,
+      "loss": 1.9548,
+      "step": 1000
+    },
+    {
+      "epoch": 2.91,
+      "eval_loss": 1.0889918804168701,
+      "eval_runtime": 243.6531,
+      "eval_samples_per_second": 18.961,
+      "eval_steps_per_second": 4.74,
+      "eval_wer": 0.8601847885945053,
+      "step": 1000
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 0.00055,
+      "loss": 1.9588,
+      "step": 1100
+    },
+    {
+      "epoch": 3.49,
+      "learning_rate": 0.0006,
+      "loss": 1.9734,
+      "step": 1200
+    },
+    {
+      "epoch": 3.78,
+      "learning_rate": 0.0006495,
+      "loss": 1.9725,
+      "step": 1300
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 0.0006995,
+      "loss": 1.9717,
+      "step": 1400
+    },
+    {
+      "epoch": 4.36,
+      "learning_rate": 0.0007495000000000001,
+      "loss": 1.9568,
+      "step": 1500
+    },
+    {
+      "epoch": 4.36,
+      "eval_loss": 1.0877875089645386,
+      "eval_runtime": 239.5705,
+      "eval_samples_per_second": 19.285,
+      "eval_steps_per_second": 4.821,
+      "eval_wer": 0.868016887964266,
+      "step": 1500
+    },
+    {
+      "epoch": 4.65,
+      "learning_rate": 0.0007995,
+      "loss": 1.9528,
+      "step": 1600
+    },
+    {
+      "epoch": 4.94,
+      "learning_rate": 0.0008495000000000001,
+      "loss": 1.9862,
+      "step": 1700
+    },
+    {
+      "epoch": 5.23,
+      "learning_rate": 0.0008995,
+      "loss": 1.9592,
+      "step": 1800
+    },
+    {
+      "epoch": 5.52,
+      "learning_rate": 0.0009495,
+      "loss": 1.938,
+      "step": 1900
+    },
+    {
+      "epoch": 5.81,
+      "learning_rate": 0.0009995000000000002,
+      "loss": 1.9497,
+      "step": 2000
+    },
+    {
+      "epoch": 5.81,
+      "eval_loss": 1.1500531435012817,
+      "eval_runtime": 242.7035,
+      "eval_samples_per_second": 19.036,
+      "eval_steps_per_second": 4.759,
+      "eval_wer": 0.8837728691182769,
+      "step": 2000
+    },
+    {
+      "epoch": 6.1,
+      "learning_rate": 0.00093125,
+      "loss": 1.9326,
+      "step": 2100
+    },
+    {
+      "epoch": 6.39,
+      "learning_rate": 0.0008618055555555557,
+      "loss": 1.8927,
+      "step": 2200
+    },
+    {
+      "epoch": 6.68,
+      "learning_rate": 0.0007923611111111111,
+      "loss": 1.8929,
+      "step": 2300
+    },
+    {
+      "epoch": 6.97,
+      "learning_rate": 0.0007229166666666666,
+      "loss": 1.8684,
+      "step": 2400
+    },
+    {
+      "epoch": 7.27,
+      "learning_rate": 0.0006534722222222223,
+      "loss": 1.8453,
+      "step": 2500
+    },
+    {
+      "epoch": 7.27,
+      "eval_loss": 1.0452075004577637,
+      "eval_runtime": 247.1245,
+      "eval_samples_per_second": 18.695,
+      "eval_steps_per_second": 4.674,
+      "eval_wer": 0.8417977115584654,
+      "step": 2500
+    },
+    {
+      "epoch": 7.56,
+      "learning_rate": 0.0005840277777777778,
+      "loss": 1.8081,
+      "step": 2600
+    },
+    {
+      "epoch": 7.85,
+      "learning_rate": 0.0005145833333333333,
+      "loss": 1.78,
+      "step": 2700
+    },
+    {
+      "epoch": 8.14,
+      "learning_rate": 0.00044513888888888885,
+      "loss": 1.7618,
+      "step": 2800
+    },
+    {
+      "epoch": 8.43,
+      "learning_rate": 0.00037569444444444445,
+      "loss": 1.7155,
+      "step": 2900
+    },
+    {
+      "epoch": 8.72,
+      "learning_rate": 0.00030625000000000004,
+      "loss": 1.6952,
+      "step": 3000
+    },
+    {
+      "epoch": 8.72,
+      "eval_loss": 0.9152895212173462,
+      "eval_runtime": 242.409,
+      "eval_samples_per_second": 19.059,
+      "eval_steps_per_second": 4.765,
+      "eval_wer": 0.7822615186930184,
+      "step": 3000
+    },
+    {
+      "epoch": 9.01,
+      "learning_rate": 0.00023680555555555556,
+      "loss": 1.6874,
+      "step": 3100
+    },
+    {
+      "epoch": 9.3,
+      "learning_rate": 0.0001673611111111111,
+      "loss": 1.6143,
+      "step": 3200
+    },
+    {
+      "epoch": 9.59,
+      "learning_rate": 9.791666666666667e-05,
+      "loss": 1.5948,
+      "step": 3300
+    },
+    {
+      "epoch": 9.88,
+      "learning_rate": 2.9166666666666666e-05,
+      "loss": 1.5723,
+      "step": 3400
+    },
+    {
+      "epoch": 10.0,
+      "step": 3440,
+      "total_flos": 1.01153307245466e+19,
+      "train_loss": 2.1586562755496,
+      "train_runtime": 12185.0109,
+      "train_samples_per_second": 9.052,
+      "train_steps_per_second": 0.282
+    }
+  ],
+  "max_steps": 3440,
+  "num_train_epochs": 10,
+  "total_flos": 1.01153307245466e+19,
+  "trial_name": null,
+  "trial_params": null
+}