Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

model.safetensors +1 -1
optimizer.pt +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
special_tokens_map.json +2 -2
trainer_state.json +424 -0
training_args.bin +1 -1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9d690a20589ae9870a61c03da7e42e40ae9f851b4ea79d84ff8753a297964bdc
 size 966995080

 version https://git-lfs.github.com/spec/v1
+oid sha256:18cd7996ecd1dc1dbf420a0ab81cde0036b12228cd22ea965a010840f2764c2b
 size 966995080

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d03bf4c067b9597eac26dc4a2f0fc8834aad5468187f83f4a7dd2c2331eefe33
+size 1925064044

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4a52f081f4924293d8474c5485e0b13c875749c1e09e4a911fccb555cb30e0d5
+size 14244

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e90b02d24fe55c96080d5eba73dc857321a59f84e8aeacc796ac8510ea27424c
+size 1064

special_tokens_map.json CHANGED Viewed

@@ -125,14 +125,14 @@
   "pad_token": {
     "content": "<|endoftext|>",
     "lstrip": false,
-    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "unk_token": {
     "content": "",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   }

   "pad_token": {
     "content": "<|endoftext|>",
     "lstrip": false,
+    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "unk_token": {
     "content": "",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   }

trainer_state.json ADDED Viewed

	@@ -0,0 +1,424 @@

+{
+  "best_metric": 37.0919881305638,
+  "best_model_checkpoint": "abuelnasr/whisper-small-eg/checkpoint-1020",
+  "epoch": 4.2677824267782425,
+  "eval_steps": 60,
+  "global_step": 1020,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.12552301255230125,
+      "grad_norm": 22.29438018798828,
+      "learning_rate": 8.666666666666668e-07,
+      "loss": 2.7449,
+      "step": 30
+    },
+    {
+      "epoch": 0.2510460251046025,
+      "grad_norm": 13.858986854553223,
+      "learning_rate": 1.8666666666666669e-06,
+      "loss": 2.0487,
+      "step": 60
+    },
+    {
+      "epoch": 0.2510460251046025,
+      "eval_loss": 1.6403740644454956,
+      "eval_runtime": 248.9943,
+      "eval_samples_per_second": 1.627,
+      "eval_steps_per_second": 0.052,
+      "eval_wer": 72.87833827893175,
+      "step": 60
+    },
+    {
+      "epoch": 0.37656903765690375,
+      "grad_norm": 10.086219787597656,
+      "learning_rate": 2.866666666666667e-06,
+      "loss": 1.3133,
+      "step": 90
+    },
+    {
+      "epoch": 0.502092050209205,
+      "grad_norm": 10.840757369995117,
+      "learning_rate": 3.866666666666667e-06,
+      "loss": 1.1414,
+      "step": 120
+    },
+    {
+      "epoch": 0.502092050209205,
+      "eval_loss": 1.0603028535842896,
+      "eval_runtime": 279.3129,
+      "eval_samples_per_second": 1.45,
+      "eval_steps_per_second": 0.047,
+      "eval_wer": 73.33333333333333,
+      "step": 120
+    },
+    {
+      "epoch": 0.6276150627615062,
+      "grad_norm": 9.947965621948242,
+      "learning_rate": 4.866666666666667e-06,
+      "loss": 0.9772,
+      "step": 150
+    },
+    {
+      "epoch": 0.7531380753138075,
+      "grad_norm": 7.831133842468262,
+      "learning_rate": 4.926553672316385e-06,
+      "loss": 0.8749,
+      "step": 180
+    },
+    {
+      "epoch": 0.7531380753138075,
+      "eval_loss": 0.865332841873169,
+      "eval_runtime": 239.6319,
+      "eval_samples_per_second": 1.69,
+      "eval_steps_per_second": 0.054,
+      "eval_wer": 64.15430267062314,
+      "step": 180
+    },
+    {
+      "epoch": 0.8786610878661087,
+      "grad_norm": 7.919336318969727,
+      "learning_rate": 4.84180790960452e-06,
+      "loss": 0.8123,
+      "step": 210
+    },
+    {
+      "epoch": 1.00418410041841,
+      "grad_norm": 8.757369995117188,
+      "learning_rate": 4.757062146892656e-06,
+      "loss": 0.7374,
+      "step": 240
+    },
+    {
+      "epoch": 1.00418410041841,
+      "eval_loss": 0.6884974837303162,
+      "eval_runtime": 220.1085,
+      "eval_samples_per_second": 1.84,
+      "eval_steps_per_second": 0.059,
+      "eval_wer": 53.03659742828882,
+      "step": 240
+    },
+    {
+      "epoch": 1.1297071129707112,
+      "grad_norm": 6.005550861358643,
+      "learning_rate": 4.672316384180791e-06,
+      "loss": 0.5269,
+      "step": 270
+    },
+    {
+      "epoch": 1.2552301255230125,
+      "grad_norm": 5.889186382293701,
+      "learning_rate": 4.587570621468927e-06,
+      "loss": 0.5152,
+      "step": 300
+    },
+    {
+      "epoch": 1.2552301255230125,
+      "eval_loss": 0.5685195326805115,
+      "eval_runtime": 221.5589,
+      "eval_samples_per_second": 1.828,
+      "eval_steps_per_second": 0.059,
+      "eval_wer": 49.61424332344214,
+      "step": 300
+    },
+    {
+      "epoch": 1.3807531380753137,
+      "grad_norm": 5.900785446166992,
+      "learning_rate": 4.5028248587570625e-06,
+      "loss": 0.4884,
+      "step": 330
+    },
+    {
+      "epoch": 1.506276150627615,
+      "grad_norm": 5.92984676361084,
+      "learning_rate": 4.418079096045198e-06,
+      "loss": 0.4816,
+      "step": 360
+    },
+    {
+      "epoch": 1.506276150627615,
+      "eval_loss": 0.5440375804901123,
+      "eval_runtime": 268.521,
+      "eval_samples_per_second": 1.508,
+      "eval_steps_per_second": 0.048,
+      "eval_wer": 58.496538081107815,
+      "step": 360
+    },
+    {
+      "epoch": 1.6317991631799162,
+      "grad_norm": 5.4634318351745605,
+      "learning_rate": 4.333333333333334e-06,
+      "loss": 0.488,
+      "step": 390
+    },
+    {
+      "epoch": 1.7573221757322175,
+      "grad_norm": 6.412497043609619,
+      "learning_rate": 4.248587570621469e-06,
+      "loss": 0.4465,
+      "step": 420
+    },
+    {
+      "epoch": 1.7573221757322175,
+      "eval_loss": 0.5248781442642212,
+      "eval_runtime": 258.4515,
+      "eval_samples_per_second": 1.567,
+      "eval_steps_per_second": 0.05,
+      "eval_wer": 62.156280909990116,
+      "step": 420
+    },
+    {
+      "epoch": 1.8828451882845187,
+      "grad_norm": 6.152505874633789,
+      "learning_rate": 4.1638418079096045e-06,
+      "loss": 0.4736,
+      "step": 450
+    },
+    {
+      "epoch": 2.00836820083682,
+      "grad_norm": 5.672488689422607,
+      "learning_rate": 4.079096045197741e-06,
+      "loss": 0.4399,
+      "step": 480
+    },
+    {
+      "epoch": 2.00836820083682,
+      "eval_loss": 0.5114672183990479,
+      "eval_runtime": 279.1622,
+      "eval_samples_per_second": 1.451,
+      "eval_steps_per_second": 0.047,
+      "eval_wer": 67.24035608308606,
+      "step": 480
+    },
+    {
+      "epoch": 2.1338912133891212,
+      "grad_norm": 6.103506565093994,
+      "learning_rate": 3.994350282485876e-06,
+      "loss": 0.3451,
+      "step": 510
+    },
+    {
+      "epoch": 2.2594142259414225,
+      "grad_norm": 5.109236717224121,
+      "learning_rate": 3.909604519774012e-06,
+      "loss": 0.3324,
+      "step": 540
+    },
+    {
+      "epoch": 2.2594142259414225,
+      "eval_loss": 0.5136451721191406,
+      "eval_runtime": 268.029,
+      "eval_samples_per_second": 1.511,
+      "eval_steps_per_second": 0.049,
+      "eval_wer": 54.77744807121662,
+      "step": 540
+    },
+    {
+      "epoch": 2.3849372384937237,
+      "grad_norm": 4.577359199523926,
+      "learning_rate": 3.8248587570621474e-06,
+      "loss": 0.3343,
+      "step": 570
+    },
+    {
+      "epoch": 2.510460251046025,
+      "grad_norm": 6.362017631530762,
+      "learning_rate": 3.7401129943502828e-06,
+      "loss": 0.3366,
+      "step": 600
+    },
+    {
+      "epoch": 2.510460251046025,
+      "eval_loss": 0.5054488778114319,
+      "eval_runtime": 259.5993,
+      "eval_samples_per_second": 1.56,
+      "eval_steps_per_second": 0.05,
+      "eval_wer": 49.00098911968348,
+      "step": 600
+    },
+    {
+      "epoch": 2.6359832635983262,
+      "grad_norm": 4.350444316864014,
+      "learning_rate": 3.655367231638418e-06,
+      "loss": 0.3447,
+      "step": 630
+    },
+    {
+      "epoch": 2.7615062761506275,
+      "grad_norm": 4.399082183837891,
+      "learning_rate": 3.570621468926554e-06,
+      "loss": 0.3232,
+      "step": 660
+    },
+    {
+      "epoch": 2.7615062761506275,
+      "eval_loss": 0.4949069023132324,
+      "eval_runtime": 249.7373,
+      "eval_samples_per_second": 1.622,
+      "eval_steps_per_second": 0.052,
+      "eval_wer": 42.57171117705242,
+      "step": 660
+    },
+    {
+      "epoch": 2.8870292887029287,
+      "grad_norm": 4.29299259185791,
+      "learning_rate": 3.48587570621469e-06,
+      "loss": 0.3365,
+      "step": 690
+    },
+    {
+      "epoch": 3.01255230125523,
+      "grad_norm": 4.033880710601807,
+      "learning_rate": 3.401129943502825e-06,
+      "loss": 0.3374,
+      "step": 720
+    },
+    {
+      "epoch": 3.01255230125523,
+      "eval_loss": 0.487780898809433,
+      "eval_runtime": 280.4517,
+      "eval_samples_per_second": 1.444,
+      "eval_steps_per_second": 0.046,
+      "eval_wer": 43.48170128585559,
+      "step": 720
+    },
+    {
+      "epoch": 3.1380753138075312,
+      "grad_norm": 3.836930274963379,
+      "learning_rate": 3.316384180790961e-06,
+      "loss": 0.2821,
+      "step": 750
+    },
+    {
+      "epoch": 3.2635983263598325,
+      "grad_norm": 4.796186447143555,
+      "learning_rate": 3.231638418079096e-06,
+      "loss": 0.2295,
+      "step": 780
+    },
+    {
+      "epoch": 3.2635983263598325,
+      "eval_loss": 0.4930148124694824,
+      "eval_runtime": 270.3473,
+      "eval_samples_per_second": 1.498,
+      "eval_steps_per_second": 0.048,
+      "eval_wer": 46.70623145400594,
+      "step": 780
+    },
+    {
+      "epoch": 3.3891213389121337,
+      "grad_norm": 4.248520851135254,
+      "learning_rate": 3.146892655367232e-06,
+      "loss": 0.2681,
+      "step": 810
+    },
+    {
+      "epoch": 3.514644351464435,
+      "grad_norm": 4.470262050628662,
+      "learning_rate": 3.0621468926553677e-06,
+      "loss": 0.2479,
+      "step": 840
+    },
+    {
+      "epoch": 3.514644351464435,
+      "eval_loss": 0.4894804358482361,
+      "eval_runtime": 250.2043,
+      "eval_samples_per_second": 1.619,
+      "eval_steps_per_second": 0.052,
+      "eval_wer": 41.66172106824926,
+      "step": 840
+    },
+    {
+      "epoch": 3.6401673640167362,
+      "grad_norm": 4.155009746551514,
+      "learning_rate": 2.977401129943503e-06,
+      "loss": 0.2438,
+      "step": 870
+    },
+    {
+      "epoch": 3.7656903765690375,
+      "grad_norm": 4.195906639099121,
+      "learning_rate": 2.8926553672316388e-06,
+      "loss": 0.2419,
+      "step": 900
+    },
+    {
+      "epoch": 3.7656903765690375,
+      "eval_loss": 0.4896373152732849,
+      "eval_runtime": 258.2624,
+      "eval_samples_per_second": 1.568,
+      "eval_steps_per_second": 0.05,
+      "eval_wer": 46.36993076162216,
+      "step": 900
+    },
+    {
+      "epoch": 3.891213389121339,
+      "grad_norm": 4.5145487785339355,
+      "learning_rate": 2.807909604519774e-06,
+      "loss": 0.2525,
+      "step": 930
+    },
+    {
+      "epoch": 4.01673640167364,
+      "grad_norm": 3.6618359088897705,
+      "learning_rate": 2.72316384180791e-06,
+      "loss": 0.2373,
+      "step": 960
+    },
+    {
+      "epoch": 4.01673640167364,
+      "eval_loss": 0.4873057007789612,
+      "eval_runtime": 238.693,
+      "eval_samples_per_second": 1.697,
+      "eval_steps_per_second": 0.054,
+      "eval_wer": 39.58456973293769,
+      "step": 960
+    },
+    {
+      "epoch": 4.142259414225942,
+      "grad_norm": 3.126338481903076,
+      "learning_rate": 2.6384180790960455e-06,
+      "loss": 0.1846,
+      "step": 990
+    },
+    {
+      "epoch": 4.2677824267782425,
+      "grad_norm": 3.1524906158447266,
+      "learning_rate": 2.553672316384181e-06,
+      "loss": 0.1887,
+      "step": 1020
+    },
+    {
+      "epoch": 4.2677824267782425,
+      "eval_loss": 0.49608033895492554,
+      "eval_runtime": 222.7087,
+      "eval_samples_per_second": 1.819,
+      "eval_steps_per_second": 0.058,
+      "eval_wer": 37.0919881305638,
+      "step": 1020
+    }
+  ],
+  "logging_steps": 30,
+  "max_steps": 1920,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 9,
+  "save_steps": 60,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 9.3963406344192e+18,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5da4c034eeb232905005518b17d56280354b5b29bce74a33770a676322c5b4a2
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:adf550daf7a5c2b9708f6b489eacc1d897e3f311426c9c3af9d27457b030a65e
 size 5368