DrishtiSharma
/

wav2vec2-xls-r-myv-a1

+{
+    "epoch": 200.0,
+    "eval_loss": 1.0355710983276367,
+    "eval_runtime": 14.0252,
+    "eval_samples": 294,
+    "eval_samples_per_second": 20.962,
+    "eval_steps_per_second": 0.713,
+    "eval_wer": 0.6523702031602708,
+    "train_loss": 0.8014375554598295,
+    "train_runtime": 12807.5215,
+    "train_samples": 828,
+    "train_samples_per_second": 12.93,
+    "train_steps_per_second": 0.812
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 200.0,
+    "eval_loss": 1.0355710983276367,
+    "eval_runtime": 14.0252,
+    "eval_samples": 294,
+    "eval_samples_per_second": 20.962,
+    "eval_steps_per_second": 0.713,
+    "eval_wer": 0.6523702031602708
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 200.0,
+    "train_loss": 0.8014375554598295,
+    "train_runtime": 12807.5215,
+    "train_samples": 828,
+    "train_samples_per_second": 12.93,
+    "train_steps_per_second": 0.812
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,409 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 200.0,
+  "global_step": 10400,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 5.77,
+      "learning_rate": 0.000148,
+      "loss": 5.649,
+      "step": 300
+    },
+    {
+      "epoch": 9.62,
+      "eval_loss": 3.0038444995880127,
+      "eval_runtime": 14.1536,
+      "eval_samples_per_second": 20.772,
+      "eval_steps_per_second": 0.707,
+      "eval_wer": 1.0,
+      "step": 500
+    },
+    {
+      "epoch": 11.54,
+      "learning_rate": 0.00029800000000000003,
+      "loss": 2.9978,
+      "step": 600
+    },
+    {
+      "epoch": 17.31,
+      "learning_rate": 0.00039600000000000003,
+      "loss": 1.6272,
+      "step": 900
+    },
+    {
+      "epoch": 19.23,
+      "eval_loss": 0.7362223267555237,
+      "eval_runtime": 13.8179,
+      "eval_samples_per_second": 21.277,
+      "eval_steps_per_second": 0.724,
+      "eval_wer": 0.781941309255079,
+      "step": 1000
+    },
+    {
+      "epoch": 23.08,
+      "learning_rate": 0.0003835,
+      "loss": 1.2822,
+      "step": 1200
+    },
+    {
+      "epoch": 28.85,
+      "learning_rate": 0.000371,
+      "loss": 1.1354,
+      "step": 1500
+    },
+    {
+      "epoch": 28.85,
+      "eval_loss": 0.6409761309623718,
+      "eval_runtime": 13.8178,
+      "eval_samples_per_second": 21.277,
+      "eval_steps_per_second": 0.724,
+      "eval_wer": 0.7110609480812641,
+      "step": 1500
+    },
+    {
+      "epoch": 34.62,
+      "learning_rate": 0.00035850000000000004,
+      "loss": 1.0424,
+      "step": 1800
+    },
+    {
+      "epoch": 38.46,
+      "eval_loss": 0.6907294392585754,
+      "eval_runtime": 13.9619,
+      "eval_samples_per_second": 21.057,
+      "eval_steps_per_second": 0.716,
+      "eval_wer": 0.7431151241534989,
+      "step": 2000
+    },
+    {
+      "epoch": 40.38,
+      "learning_rate": 0.000346,
+      "loss": 0.9872,
+      "step": 2100
+    },
+    {
+      "epoch": 46.15,
+      "learning_rate": 0.00033350000000000003,
+      "loss": 0.9293,
+      "step": 2400
+    },
+    {
+      "epoch": 48.08,
+      "eval_loss": 0.7248561978340149,
+      "eval_runtime": 14.1849,
+      "eval_samples_per_second": 20.726,
+      "eval_steps_per_second": 0.705,
+      "eval_wer": 0.7101580135440181,
+      "step": 2500
+    },
+    {
+      "epoch": 51.92,
+      "learning_rate": 0.000321,
+      "loss": 0.8747,
+      "step": 2700
+    },
+    {
+      "epoch": 57.69,
+      "learning_rate": 0.0003085,
+      "loss": 0.8246,
+      "step": 3000
+    },
+    {
+      "epoch": 57.69,
+      "eval_loss": 0.7421836853027344,
+      "eval_runtime": 14.4192,
+      "eval_samples_per_second": 20.39,
+      "eval_steps_per_second": 0.694,
+      "eval_wer": 0.6966139954853273,
+      "step": 3000
+    },
+    {
+      "epoch": 63.46,
+      "learning_rate": 0.000296,
+      "loss": 0.7837,
+      "step": 3300
+    },
+    {
+      "epoch": 67.31,
+      "eval_loss": 0.7412946820259094,
+      "eval_runtime": 14.1823,
+      "eval_samples_per_second": 20.73,
+      "eval_steps_per_second": 0.705,
+      "eval_wer": 0.6812641083521445,
+      "step": 3500
+    },
+    {
+      "epoch": 69.23,
+      "learning_rate": 0.0002835,
+      "loss": 0.7527,
+      "step": 3600
+    },
+    {
+      "epoch": 75.0,
+      "learning_rate": 0.00027100000000000003,
+      "loss": 0.7147,
+      "step": 3900
+    },
+    {
+      "epoch": 76.92,
+      "eval_loss": 0.7873469591140747,
+      "eval_runtime": 13.9067,
+      "eval_samples_per_second": 21.141,
+      "eval_steps_per_second": 0.719,
+      "eval_wer": 0.6930022573363431,
+      "step": 4000
+    },
+    {
+      "epoch": 80.77,
+      "learning_rate": 0.0002585,
+      "loss": 0.6779,
+      "step": 4200
+    },
+    {
+      "epoch": 86.54,
+      "learning_rate": 0.000246,
+      "loss": 0.6276,
+      "step": 4500
+    },
+    {
+      "epoch": 86.54,
+      "eval_loss": 0.8037810921669006,
+      "eval_runtime": 14.0837,
+      "eval_samples_per_second": 20.875,
+      "eval_steps_per_second": 0.71,
+      "eval_wer": 0.6677200902934537,
+      "step": 4500
+    },
+    {
+      "epoch": 92.31,
+      "learning_rate": 0.0002335,
+      "loss": 0.6041,
+      "step": 4800
+    },
+    {
+      "epoch": 96.15,
+      "eval_loss": 0.8240488767623901,
+      "eval_runtime": 13.9338,
+      "eval_samples_per_second": 21.1,
+      "eval_steps_per_second": 0.718,
+      "eval_wer": 0.6830699774266366,
+      "step": 5000
+    },
+    {
+      "epoch": 98.08,
+      "learning_rate": 0.000221,
+      "loss": 0.5588,
+      "step": 5100
+    },
+    {
+      "epoch": 103.85,
+      "learning_rate": 0.0002085,
+      "loss": 0.5336,
+      "step": 5400
+    },
+    {
+      "epoch": 105.77,
+      "eval_loss": 0.8747946619987488,
+      "eval_runtime": 13.9807,
+      "eval_samples_per_second": 21.029,
+      "eval_steps_per_second": 0.715,
+      "eval_wer": 0.6749435665914221,
+      "step": 5500
+    },
+    {
+      "epoch": 109.62,
+      "learning_rate": 0.000196,
+      "loss": 0.5,
+      "step": 5700
+    },
+    {
+      "epoch": 115.38,
+      "learning_rate": 0.00018350000000000002,
+      "loss": 0.4705,
+      "step": 6000
+    },
+    {
+      "epoch": 115.38,
+      "eval_loss": 0.9005643129348755,
+      "eval_runtime": 13.867,
+      "eval_samples_per_second": 21.201,
+      "eval_steps_per_second": 0.721,
+      "eval_wer": 0.6496613995485327,
+      "step": 6000
+    },
+    {
+      "epoch": 121.15,
+      "learning_rate": 0.00017104166666666667,
+      "loss": 0.43,
+      "step": 6300
+    },
+    {
+      "epoch": 125.0,
+      "eval_loss": 0.8953593969345093,
+      "eval_runtime": 13.9621,
+      "eval_samples_per_second": 21.057,
+      "eval_steps_per_second": 0.716,
+      "eval_wer": 0.655079006772009,
+      "step": 6500
+    },
+    {
+      "epoch": 126.92,
+      "learning_rate": 0.00015854166666666667,
+      "loss": 0.4068,
+      "step": 6600
+    },
+    {
+      "epoch": 132.69,
+      "learning_rate": 0.0001460416666666667,
+      "loss": 0.3859,
+      "step": 6900
+    },
+    {
+      "epoch": 134.62,
+      "eval_loss": 0.9073536396026611,
+      "eval_runtime": 13.9518,
+      "eval_samples_per_second": 21.072,
+      "eval_steps_per_second": 0.717,
+      "eval_wer": 0.6613995485327314,
+      "step": 7000
+    },
+    {
+      "epoch": 138.46,
+      "learning_rate": 0.00013354166666666668,
+      "loss": 0.3622,
+      "step": 7200
+    },
+    {
+      "epoch": 144.23,
+      "learning_rate": 0.00012104166666666668,
+      "loss": 0.3342,
+      "step": 7500
+    },
+    {
+      "epoch": 144.23,
+      "eval_loss": 0.9693499803543091,
+      "eval_runtime": 13.8467,
+      "eval_samples_per_second": 21.233,
+      "eval_steps_per_second": 0.722,
+      "eval_wer": 0.6559819413092551,
+      "step": 7500
+    },
+    {
+      "epoch": 150.0,
+      "learning_rate": 0.00010854166666666667,
+      "loss": 0.3155,
+      "step": 7800
+    },
+    {
+      "epoch": 153.85,
+      "eval_loss": 1.0072590112686157,
+      "eval_runtime": 13.7449,
+      "eval_samples_per_second": 21.39,
+      "eval_steps_per_second": 0.728,
+      "eval_wer": 0.6690744920993228,
+      "step": 8000
+    },
+    {
+      "epoch": 155.77,
+      "learning_rate": 9.604166666666668e-05,
+      "loss": 0.2894,
+      "step": 8100
+    },
+    {
+      "epoch": 161.54,
+      "learning_rate": 8.358333333333334e-05,
+      "loss": 0.2673,
+      "step": 8400
+    },
+    {
+      "epoch": 163.46,
+      "eval_loss": 1.0170269012451172,
+      "eval_runtime": 14.0595,
+      "eval_samples_per_second": 20.911,
+      "eval_steps_per_second": 0.711,
+      "eval_wer": 0.6632054176072235,
+      "step": 8500
+    },
+    {
+      "epoch": 167.31,
+      "learning_rate": 7.108333333333333e-05,
+      "loss": 0.2517,
+      "step": 8700
+    },
+    {
+      "epoch": 173.08,
+      "learning_rate": 5.858333333333333e-05,
+      "loss": 0.2409,
+      "step": 9000
+    },
+    {
+      "epoch": 173.08,
+      "eval_loss": 1.0304286479949951,
+      "eval_runtime": 13.8942,
+      "eval_samples_per_second": 21.16,
+      "eval_steps_per_second": 0.72,
+      "eval_wer": 0.6708803611738149,
+      "step": 9000
+    },
+    {
+      "epoch": 178.85,
+      "learning_rate": 4.608333333333333e-05,
+      "loss": 0.2189,
+      "step": 9300
+    },
+    {
+      "epoch": 182.69,
+      "eval_loss": 0.9965260624885559,
+      "eval_runtime": 14.2442,
+      "eval_samples_per_second": 20.64,
+      "eval_steps_per_second": 0.702,
+      "eval_wer": 0.654627539503386,
+      "step": 9500
+    },
+    {
+      "epoch": 184.62,
+      "learning_rate": 3.3625000000000004e-05,
+      "loss": 0.203,
+      "step": 9600
+    },
+    {
+      "epoch": 190.38,
+      "learning_rate": 2.1125000000000002e-05,
+      "loss": 0.1973,
+      "step": 9900
+    },
+    {
+      "epoch": 192.31,
+      "eval_loss": 1.0360474586486816,
+      "eval_runtime": 14.1087,
+      "eval_samples_per_second": 20.838,
+      "eval_steps_per_second": 0.709,
+      "eval_wer": 0.655079006772009,
+      "step": 10000
+    },
+    {
+      "epoch": 196.15,
+      "learning_rate": 8.625e-06,
+      "loss": 0.1881,
+      "step": 10200
+    },
+    {
+      "epoch": 200.0,
+      "step": 10400,
+      "total_flos": 3.0179570579437056e+19,
+      "train_loss": 0.8014375554598295,
+      "train_runtime": 12807.5215,
+      "train_samples_per_second": 12.93,
+      "train_steps_per_second": 0.812
+    }
+  ],
+  "max_steps": 10400,
+  "num_train_epochs": 200,
+  "total_flos": 3.0179570579437056e+19,
+  "trial_name": null,
+  "trial_params": null
+}