xezpeleta commited on Jul 23, 2023

Commit

2810135

1 Parent(s): f1570bc

Update the learning rate hyperparameter

Browse files

Files changed (47) hide show

checkpoint-1000/config.json +0 -41
checkpoint-1000/optimizer.pt +0 -3
checkpoint-1000/preprocessor_config.json +0 -0
checkpoint-1000/pytorch_model.bin +0 -3
checkpoint-1000/rng_state.pth +0 -3
checkpoint-1000/scaler.pt +0 -3
checkpoint-1000/scheduler.pt +0 -3
checkpoint-1000/trainer_state.json +0 -265
checkpoint-1000/training_args.bin +0 -3
checkpoint-2000/config.json +0 -41
checkpoint-2000/optimizer.pt +0 -3
checkpoint-2000/preprocessor_config.json +0 -0
checkpoint-2000/pytorch_model.bin +0 -3
checkpoint-2000/rng_state.pth +0 -3
checkpoint-2000/scaler.pt +0 -3
checkpoint-2000/scheduler.pt +0 -3
checkpoint-2000/trainer_state.json +0 -514
checkpoint-2000/training_args.bin +0 -3
checkpoint-3000/config.json +0 -41
checkpoint-3000/optimizer.pt +0 -3
checkpoint-3000/preprocessor_config.json +0 -0
checkpoint-3000/pytorch_model.bin +0 -3
checkpoint-3000/rng_state.pth +0 -3
checkpoint-3000/scaler.pt +0 -3
checkpoint-3000/scheduler.pt +0 -3
checkpoint-3000/trainer_state.json +0 -763
checkpoint-3000/training_args.bin +0 -3
checkpoint-4000/config.json +0 -41
checkpoint-4000/optimizer.pt +0 -3
checkpoint-4000/preprocessor_config.json +0 -0
checkpoint-4000/pytorch_model.bin +0 -3
checkpoint-4000/rng_state.pth +0 -3
checkpoint-4000/scaler.pt +0 -3
checkpoint-4000/scheduler.pt +0 -3
checkpoint-4000/trainer_state.json +0 -1012
checkpoint-4000/training_args.bin +0 -3
checkpoint-5000/config.json +0 -41
checkpoint-5000/optimizer.pt +0 -3
checkpoint-5000/preprocessor_config.json +0 -0
checkpoint-5000/pytorch_model.bin +0 -3
checkpoint-5000/rng_state.pth +0 -3
checkpoint-5000/scaler.pt +0 -3
checkpoint-5000/scheduler.pt +0 -3
checkpoint-5000/trainer_state.json +0 -1261
checkpoint-5000/training_args.bin +0 -3
nohup.out +0 -0
run.sh +3 -3

checkpoint-1000/config.json DELETED Viewed

@@ -1,41 +0,0 @@
-{
-  "_name_or_path": "openai/whisper-medium",
-  "activation_dropout": 0.0,
-  "activation_function": "gelu",
-  "architectures": [
-    "WhisperForConditionalGeneration"
-  ],
-  "attention_dropout": 0.0,
-  "begin_suppress_tokens": [
-    220,
-    50257
-  ],
-  "bos_token_id": 50257,
-  "d_model": 1024,
-  "decoder_attention_heads": 16,
-  "decoder_ffn_dim": 4096,
-  "decoder_layerdrop": 0.0,
-  "decoder_layers": 24,
-  "decoder_start_token_id": 50258,
-  "dropout": 0.0,
-  "encoder_attention_heads": 16,
-  "encoder_ffn_dim": 4096,
-  "encoder_layerdrop": 0.0,
-  "encoder_layers": 24,
-  "eos_token_id": 50257,
-  "forced_decoder_ids": null,
-  "init_std": 0.02,
-  "is_encoder_decoder": true,
-  "max_length": 448,
-  "max_source_positions": 1500,
-  "max_target_positions": 448,
-  "model_type": "whisper",
-  "num_hidden_layers": 24,
-  "num_mel_bins": 80,
-  "pad_token_id": 50257,
-  "scale_embedding": false,
-  "torch_dtype": "float32",
-  "transformers_version": "4.26.0.dev0",
-  "use_cache": false,
-  "vocab_size": 51865
-}

checkpoint-1000/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e445adc1c3c18c87959585f1c753c47cddbfe8321f2096b28ccdc0105f64d216
-size 6111428695

checkpoint-1000/preprocessor_config.json DELETED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-1000/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:ae163c1a2a53962024eae4041f8b164051aa5f9d0be4db7fd4035ffc54fcc2f7
-size 3055754841

checkpoint-1000/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:337db3bde69262529f84673e0c1688a8983313ba44ed7b47639b3c14c033c21e
-size 14575

checkpoint-1000/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:8a52443f13b1ebc1f37fc5e2f4410a0fd95d757755d28ce4ca3377896a36d719
-size 557

checkpoint-1000/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:b864fef9e9930a8de94a02300fc770f05cb6e9d2328db736b4330cf0cb6352fb
-size 627

checkpoint-1000/trainer_state.json DELETED Viewed

@@ -1,265 +0,0 @@
-{
-  "best_metric": 28.265624367127064,
-  "best_model_checkpoint": "./checkpoint-1000",
-  "epoch": 0.14285714285714285,
-  "global_step": 1000,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.0,
-      "learning_rate": 4.6000000000000004e-07,
-      "loss": 1.4182,
-      "step": 25
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 9.400000000000001e-07,
-      "loss": 1.292,
-      "step": 50
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.44e-06,
-      "loss": 1.0018,
-      "step": 75
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.94e-06,
-      "loss": 0.7765,
-      "step": 100
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.4400000000000004e-06,
-      "loss": 0.7103,
-      "step": 125
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.9400000000000002e-06,
-      "loss": 0.6597,
-      "step": 150
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.44e-06,
-      "loss": 0.6657,
-      "step": 175
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.94e-06,
-      "loss": 0.5853,
-      "step": 200
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 4.440000000000001e-06,
-      "loss": 0.5273,
-      "step": 225
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 4.94e-06,
-      "loss": 0.5979,
-      "step": 250
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.4400000000000004e-06,
-      "loss": 0.5861,
-      "step": 275
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.94e-06,
-      "loss": 0.5085,
-      "step": 300
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.440000000000001e-06,
-      "loss": 0.4827,
-      "step": 325
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.9400000000000005e-06,
-      "loss": 0.4909,
-      "step": 350
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 7.440000000000001e-06,
-      "loss": 0.4651,
-      "step": 375
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 7.94e-06,
-      "loss": 0.494,
-      "step": 400
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.44e-06,
-      "loss": 0.4188,
-      "step": 425
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.94e-06,
-      "loss": 0.3849,
-      "step": 450
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.440000000000001e-06,
-      "loss": 0.4577,
-      "step": 475
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.940000000000001e-06,
-      "loss": 0.4415,
-      "step": 500
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.966153846153847e-06,
-      "loss": 0.4614,
-      "step": 525
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.927692307692309e-06,
-      "loss": 0.4283,
-      "step": 550
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.88923076923077e-06,
-      "loss": 0.4486,
-      "step": 575
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.850769230769231e-06,
-      "loss": 0.4434,
-      "step": 600
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.812307692307694e-06,
-      "loss": 0.4245,
-      "step": 625
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.773846153846154e-06,
-      "loss": 0.4254,
-      "step": 650
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.735384615384616e-06,
-      "loss": 0.4143,
-      "step": 675
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.696923076923078e-06,
-      "loss": 0.4115,
-      "step": 700
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.658461538461539e-06,
-      "loss": 0.3656,
-      "step": 725
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.620000000000001e-06,
-      "loss": 0.4004,
-      "step": 750
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.581538461538462e-06,
-      "loss": 0.388,
-      "step": 775
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.543076923076924e-06,
-      "loss": 0.3665,
-      "step": 800
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.504615384615386e-06,
-      "loss": 0.3777,
-      "step": 825
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.466153846153846e-06,
-      "loss": 0.4338,
-      "step": 850
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.427692307692309e-06,
-      "loss": 0.4017,
-      "step": 875
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.38923076923077e-06,
-      "loss": 0.3757,
-      "step": 900
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.350769230769231e-06,
-      "loss": 0.4084,
-      "step": 925
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.312307692307693e-06,
-      "loss": 0.3821,
-      "step": 950
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.273846153846154e-06,
-      "loss": 0.421,
-      "step": 975
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.235384615384616e-06,
-      "loss": 0.4203,
-      "step": 1000
-    },
-    {
-      "epoch": 0.14,
-      "eval_loss": 0.4127572178840637,
-      "eval_runtime": 1802.5775,
-      "eval_samples_per_second": 3.656,
-      "eval_steps_per_second": 0.457,
-      "eval_wer": 28.265624367127064,
-      "step": 1000
-    }
-  ],
-  "max_steps": 7000,
-  "num_train_epochs": 9223372036854775807,
-  "total_flos": 4.08241963008e+18,
-  "trial_name": null,
-  "trial_params": null
-}

checkpoint-1000/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e1ca27d9d1bef820c87cfd52d5adb15af5250e1ac4555cd1703a088ad0dad1a4
-size 3643

checkpoint-2000/config.json DELETED Viewed

@@ -1,41 +0,0 @@
-{
-  "_name_or_path": "openai/whisper-medium",
-  "activation_dropout": 0.0,
-  "activation_function": "gelu",
-  "architectures": [
-    "WhisperForConditionalGeneration"
-  ],
-  "attention_dropout": 0.0,
-  "begin_suppress_tokens": [
-    220,
-    50257
-  ],
-  "bos_token_id": 50257,
-  "d_model": 1024,
-  "decoder_attention_heads": 16,
-  "decoder_ffn_dim": 4096,
-  "decoder_layerdrop": 0.0,
-  "decoder_layers": 24,
-  "decoder_start_token_id": 50258,
-  "dropout": 0.0,
-  "encoder_attention_heads": 16,
-  "encoder_ffn_dim": 4096,
-  "encoder_layerdrop": 0.0,
-  "encoder_layers": 24,
-  "eos_token_id": 50257,
-  "forced_decoder_ids": null,
-  "init_std": 0.02,
-  "is_encoder_decoder": true,
-  "max_length": 448,
-  "max_source_positions": 1500,
-  "max_target_positions": 448,
-  "model_type": "whisper",
-  "num_hidden_layers": 24,
-  "num_mel_bins": 80,
-  "pad_token_id": 50257,
-  "scale_embedding": false,
-  "torch_dtype": "float32",
-  "transformers_version": "4.26.0.dev0",
-  "use_cache": false,
-  "vocab_size": 51865
-}

checkpoint-2000/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:a159b02fa01e4405076f9d759e53e7edd6d412b19b53a0743c660e28339c1008
-size 6111428695

checkpoint-2000/preprocessor_config.json DELETED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-2000/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:0fb0822dc45eb083f947413e68d9023acdfbe2dc7d6aa96a85b5e714d22ce5be
-size 3055754841

checkpoint-2000/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:a1cbefc4297bef083a245f24c738abc29e75fca1b725711059d7702eeb3e5557
-size 14575

checkpoint-2000/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:be1e74deedb43759bd15ec14e78ac0bbfcb7fd82b5ef5c8669deb1c4ee4fd1f2
-size 557

checkpoint-2000/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:1f112c28e35ae8caf36bbfc9dd4dacc3130f175782da609fb5266a28a082e3cf
-size 627

checkpoint-2000/trainer_state.json DELETED Viewed

@@ -1,514 +0,0 @@
-{
-  "best_metric": 22.052330997610273,
-  "best_model_checkpoint": "./checkpoint-2000",
-  "epoch": 0.2857142857142857,
-  "global_step": 2000,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.0,
-      "learning_rate": 4.6000000000000004e-07,
-      "loss": 1.4182,
-      "step": 25
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 9.400000000000001e-07,
-      "loss": 1.292,
-      "step": 50
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.44e-06,
-      "loss": 1.0018,
-      "step": 75
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.94e-06,
-      "loss": 0.7765,
-      "step": 100
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.4400000000000004e-06,
-      "loss": 0.7103,
-      "step": 125
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.9400000000000002e-06,
-      "loss": 0.6597,
-      "step": 150
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.44e-06,
-      "loss": 0.6657,
-      "step": 175
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.94e-06,
-      "loss": 0.5853,
-      "step": 200
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 4.440000000000001e-06,
-      "loss": 0.5273,
-      "step": 225
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 4.94e-06,
-      "loss": 0.5979,
-      "step": 250
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.4400000000000004e-06,
-      "loss": 0.5861,
-      "step": 275
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.94e-06,
-      "loss": 0.5085,
-      "step": 300
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.440000000000001e-06,
-      "loss": 0.4827,
-      "step": 325
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.9400000000000005e-06,
-      "loss": 0.4909,
-      "step": 350
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 7.440000000000001e-06,
-      "loss": 0.4651,
-      "step": 375
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 7.94e-06,
-      "loss": 0.494,
-      "step": 400
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.44e-06,
-      "loss": 0.4188,
-      "step": 425
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.94e-06,
-      "loss": 0.3849,
-      "step": 450
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.440000000000001e-06,
-      "loss": 0.4577,
-      "step": 475
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.940000000000001e-06,
-      "loss": 0.4415,
-      "step": 500
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.966153846153847e-06,
-      "loss": 0.4614,
-      "step": 525
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.927692307692309e-06,
-      "loss": 0.4283,
-      "step": 550
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.88923076923077e-06,
-      "loss": 0.4486,
-      "step": 575
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.850769230769231e-06,
-      "loss": 0.4434,
-      "step": 600
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.812307692307694e-06,
-      "loss": 0.4245,
-      "step": 625
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.773846153846154e-06,
-      "loss": 0.4254,
-      "step": 650
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.735384615384616e-06,
-      "loss": 0.4143,
-      "step": 675
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.696923076923078e-06,
-      "loss": 0.4115,
-      "step": 700
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.658461538461539e-06,
-      "loss": 0.3656,
-      "step": 725
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.620000000000001e-06,
-      "loss": 0.4004,
-      "step": 750
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.581538461538462e-06,
-      "loss": 0.388,
-      "step": 775
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.543076923076924e-06,
-      "loss": 0.3665,
-      "step": 800
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.504615384615386e-06,
-      "loss": 0.3777,
-      "step": 825
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.466153846153846e-06,
-      "loss": 0.4338,
-      "step": 850
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.427692307692309e-06,
-      "loss": 0.4017,
-      "step": 875
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.38923076923077e-06,
-      "loss": 0.3757,
-      "step": 900
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.350769230769231e-06,
-      "loss": 0.4084,
-      "step": 925
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.312307692307693e-06,
-      "loss": 0.3821,
-      "step": 950
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.273846153846154e-06,
-      "loss": 0.421,
-      "step": 975
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.235384615384616e-06,
-      "loss": 0.4203,
-      "step": 1000
-    },
-    {
-      "epoch": 0.14,
-      "eval_loss": 0.4127572178840637,
-      "eval_runtime": 1802.5775,
-      "eval_samples_per_second": 3.656,
-      "eval_steps_per_second": 0.457,
-      "eval_wer": 28.265624367127064,
-      "step": 1000
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.196923076923078e-06,
-      "loss": 0.4094,
-      "step": 1025
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.158461538461539e-06,
-      "loss": 0.3674,
-      "step": 1050
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.12e-06,
-      "loss": 0.3613,
-      "step": 1075
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.081538461538463e-06,
-      "loss": 0.3904,
-      "step": 1100
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.043076923076923e-06,
-      "loss": 0.3865,
-      "step": 1125
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.004615384615386e-06,
-      "loss": 0.3677,
-      "step": 1150
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.966153846153846e-06,
-      "loss": 0.3295,
-      "step": 1175
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.927692307692308e-06,
-      "loss": 0.3207,
-      "step": 1200
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.88923076923077e-06,
-      "loss": 0.2817,
-      "step": 1225
-    },
-    {
-      "epoch": 0.18,
-      "learning_rate": 8.850769230769231e-06,
-      "loss": 0.3218,
-      "step": 1250
-    },
-    {
-      "epoch": 0.18,
-      "learning_rate": 8.812307692307693e-06,
-      "loss": 0.3502,
-      "step": 1275
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.773846153846155e-06,
-      "loss": 0.3432,
-      "step": 1300
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.735384615384616e-06,
-      "loss": 0.3244,
-      "step": 1325
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.696923076923078e-06,
-      "loss": 0.2607,
-      "step": 1350
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.658461538461538e-06,
-      "loss": 0.3469,
-      "step": 1375
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.62e-06,
-      "loss": 0.2756,
-      "step": 1400
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.581538461538463e-06,
-      "loss": 0.294,
-      "step": 1425
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.543076923076923e-06,
-      "loss": 0.3915,
-      "step": 1450
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.504615384615385e-06,
-      "loss": 0.3237,
-      "step": 1475
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.466153846153847e-06,
-      "loss": 0.2723,
-      "step": 1500
-    },
-    {
-      "epoch": 0.22,
-      "learning_rate": 8.427692307692308e-06,
-      "loss": 0.2917,
-      "step": 1525
-    },
-    {
-      "epoch": 0.22,
-      "learning_rate": 8.38923076923077e-06,
-      "loss": 0.2921,
-      "step": 1550
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.35076923076923e-06,
-      "loss": 0.3724,
-      "step": 1575
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.312307692307693e-06,
-      "loss": 0.3364,
-      "step": 1600
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.273846153846155e-06,
-      "loss": 0.3661,
-      "step": 1625
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.235384615384615e-06,
-      "loss": 0.3307,
-      "step": 1650
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.196923076923078e-06,
-      "loss": 0.3201,
-      "step": 1675
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.15846153846154e-06,
-      "loss": 0.2973,
-      "step": 1700
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.120000000000002e-06,
-      "loss": 0.3013,
-      "step": 1725
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.081538461538462e-06,
-      "loss": 0.3349,
-      "step": 1750
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.043076923076923e-06,
-      "loss": 0.3244,
-      "step": 1775
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 8.004615384615385e-06,
-      "loss": 0.3331,
-      "step": 1800
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.966153846153847e-06,
-      "loss": 0.2723,
-      "step": 1825
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.927692307692308e-06,
-      "loss": 0.316,
-      "step": 1850
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 7.88923076923077e-06,
-      "loss": 0.2648,
-      "step": 1875
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 7.850769230769232e-06,
-      "loss": 0.2965,
-      "step": 1900
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.812307692307694e-06,
-      "loss": 0.256,
-      "step": 1925
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.773846153846155e-06,
-      "loss": 0.2156,
-      "step": 1950
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.735384615384615e-06,
-      "loss": 0.2418,
-      "step": 1975
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.696923076923077e-06,
-      "loss": 0.2693,
-      "step": 2000
-    },
-    {
-      "epoch": 0.29,
-      "eval_loss": 0.3239877223968506,
-      "eval_runtime": 1817.7748,
-      "eval_samples_per_second": 3.626,
-      "eval_steps_per_second": 0.453,
-      "eval_wer": 22.052330997610273,
-      "step": 2000
-    }
-  ],
-  "max_steps": 7000,
-  "num_train_epochs": 9223372036854775807,
-  "total_flos": 8.16483926016e+18,
-  "trial_name": null,
-  "trial_params": null
-}

checkpoint-2000/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e1ca27d9d1bef820c87cfd52d5adb15af5250e1ac4555cd1703a088ad0dad1a4
-size 3643

checkpoint-3000/config.json DELETED Viewed

@@ -1,41 +0,0 @@
-{
-  "_name_or_path": "openai/whisper-medium",
-  "activation_dropout": 0.0,
-  "activation_function": "gelu",
-  "architectures": [
-    "WhisperForConditionalGeneration"
-  ],
-  "attention_dropout": 0.0,
-  "begin_suppress_tokens": [
-    220,
-    50257
-  ],
-  "bos_token_id": 50257,
-  "d_model": 1024,
-  "decoder_attention_heads": 16,
-  "decoder_ffn_dim": 4096,
-  "decoder_layerdrop": 0.0,
-  "decoder_layers": 24,
-  "decoder_start_token_id": 50258,
-  "dropout": 0.0,
-  "encoder_attention_heads": 16,
-  "encoder_ffn_dim": 4096,
-  "encoder_layerdrop": 0.0,
-  "encoder_layers": 24,
-  "eos_token_id": 50257,
-  "forced_decoder_ids": null,
-  "init_std": 0.02,
-  "is_encoder_decoder": true,
-  "max_length": 448,
-  "max_source_positions": 1500,
-  "max_target_positions": 448,
-  "model_type": "whisper",
-  "num_hidden_layers": 24,
-  "num_mel_bins": 80,
-  "pad_token_id": 50257,
-  "scale_embedding": false,
-  "torch_dtype": "float32",
-  "transformers_version": "4.26.0.dev0",
-  "use_cache": false,
-  "vocab_size": 51865
-}

checkpoint-3000/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:204df11caa5a4cc0c8bc1ea18995b04587f1d457c412b5cf195a5a895f83074c
-size 6111428695

checkpoint-3000/preprocessor_config.json DELETED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-3000/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:4e8631f8c8b760ece8b67999d400c1670f308714ab9ab1de0f37457e497096b3
-size 3055754841

checkpoint-3000/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:3be0ae51fe09627683807728545588affaec3370727df148b33392ba8055e58f
-size 14575

checkpoint-3000/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:eed3cdc5e39a2cfa8de4e0045b0e1a83c149d3d1d12677c2a9824efb5d14e59c
-size 557

checkpoint-3000/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:dd7319c75e8411b4e2ae5a8b7fcdd7bb253d178b5a5770d7926097398cb526f8
-size 627

checkpoint-3000/trainer_state.json DELETED Viewed

@@ -1,763 +0,0 @@
-{
-  "best_metric": 18.14370772408765,
-  "best_model_checkpoint": "./checkpoint-3000",
-  "epoch": 0.42857142857142855,
-  "global_step": 3000,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.0,
-      "learning_rate": 4.6000000000000004e-07,
-      "loss": 1.4182,
-      "step": 25
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 9.400000000000001e-07,
-      "loss": 1.292,
-      "step": 50
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.44e-06,
-      "loss": 1.0018,
-      "step": 75
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.94e-06,
-      "loss": 0.7765,
-      "step": 100
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.4400000000000004e-06,
-      "loss": 0.7103,
-      "step": 125
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.9400000000000002e-06,
-      "loss": 0.6597,
-      "step": 150
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.44e-06,
-      "loss": 0.6657,
-      "step": 175
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.94e-06,
-      "loss": 0.5853,
-      "step": 200
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 4.440000000000001e-06,
-      "loss": 0.5273,
-      "step": 225
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 4.94e-06,
-      "loss": 0.5979,
-      "step": 250
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.4400000000000004e-06,
-      "loss": 0.5861,
-      "step": 275
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.94e-06,
-      "loss": 0.5085,
-      "step": 300
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.440000000000001e-06,
-      "loss": 0.4827,
-      "step": 325
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.9400000000000005e-06,
-      "loss": 0.4909,
-      "step": 350
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 7.440000000000001e-06,
-      "loss": 0.4651,
-      "step": 375
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 7.94e-06,
-      "loss": 0.494,
-      "step": 400
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.44e-06,
-      "loss": 0.4188,
-      "step": 425
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.94e-06,
-      "loss": 0.3849,
-      "step": 450
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.440000000000001e-06,
-      "loss": 0.4577,
-      "step": 475
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.940000000000001e-06,
-      "loss": 0.4415,
-      "step": 500
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.966153846153847e-06,
-      "loss": 0.4614,
-      "step": 525
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.927692307692309e-06,
-      "loss": 0.4283,
-      "step": 550
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.88923076923077e-06,
-      "loss": 0.4486,
-      "step": 575
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.850769230769231e-06,
-      "loss": 0.4434,
-      "step": 600
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.812307692307694e-06,
-      "loss": 0.4245,
-      "step": 625
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.773846153846154e-06,
-      "loss": 0.4254,
-      "step": 650
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.735384615384616e-06,
-      "loss": 0.4143,
-      "step": 675
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.696923076923078e-06,
-      "loss": 0.4115,
-      "step": 700
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.658461538461539e-06,
-      "loss": 0.3656,
-      "step": 725
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.620000000000001e-06,
-      "loss": 0.4004,
-      "step": 750
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.581538461538462e-06,
-      "loss": 0.388,
-      "step": 775
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.543076923076924e-06,
-      "loss": 0.3665,
-      "step": 800
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.504615384615386e-06,
-      "loss": 0.3777,
-      "step": 825
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.466153846153846e-06,
-      "loss": 0.4338,
-      "step": 850
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.427692307692309e-06,
-      "loss": 0.4017,
-      "step": 875
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.38923076923077e-06,
-      "loss": 0.3757,
-      "step": 900
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.350769230769231e-06,
-      "loss": 0.4084,
-      "step": 925
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.312307692307693e-06,
-      "loss": 0.3821,
-      "step": 950
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.273846153846154e-06,
-      "loss": 0.421,
-      "step": 975
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.235384615384616e-06,
-      "loss": 0.4203,
-      "step": 1000
-    },
-    {
-      "epoch": 0.14,
-      "eval_loss": 0.4127572178840637,
-      "eval_runtime": 1802.5775,
-      "eval_samples_per_second": 3.656,
-      "eval_steps_per_second": 0.457,
-      "eval_wer": 28.265624367127064,
-      "step": 1000
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.196923076923078e-06,
-      "loss": 0.4094,
-      "step": 1025
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.158461538461539e-06,
-      "loss": 0.3674,
-      "step": 1050
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.12e-06,
-      "loss": 0.3613,
-      "step": 1075
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.081538461538463e-06,
-      "loss": 0.3904,
-      "step": 1100
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.043076923076923e-06,
-      "loss": 0.3865,
-      "step": 1125
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.004615384615386e-06,
-      "loss": 0.3677,
-      "step": 1150
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.966153846153846e-06,
-      "loss": 0.3295,
-      "step": 1175
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.927692307692308e-06,
-      "loss": 0.3207,
-      "step": 1200
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.88923076923077e-06,
-      "loss": 0.2817,
-      "step": 1225
-    },
-    {
-      "epoch": 0.18,
-      "learning_rate": 8.850769230769231e-06,
-      "loss": 0.3218,
-      "step": 1250
-    },
-    {
-      "epoch": 0.18,
-      "learning_rate": 8.812307692307693e-06,
-      "loss": 0.3502,
-      "step": 1275
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.773846153846155e-06,
-      "loss": 0.3432,
-      "step": 1300
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.735384615384616e-06,
-      "loss": 0.3244,
-      "step": 1325
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.696923076923078e-06,
-      "loss": 0.2607,
-      "step": 1350
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.658461538461538e-06,
-      "loss": 0.3469,
-      "step": 1375
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.62e-06,
-      "loss": 0.2756,
-      "step": 1400
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.581538461538463e-06,
-      "loss": 0.294,
-      "step": 1425
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.543076923076923e-06,
-      "loss": 0.3915,
-      "step": 1450
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.504615384615385e-06,
-      "loss": 0.3237,
-      "step": 1475
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.466153846153847e-06,
-      "loss": 0.2723,
-      "step": 1500
-    },
-    {
-      "epoch": 0.22,
-      "learning_rate": 8.427692307692308e-06,
-      "loss": 0.2917,
-      "step": 1525
-    },
-    {
-      "epoch": 0.22,
-      "learning_rate": 8.38923076923077e-06,
-      "loss": 0.2921,
-      "step": 1550
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.35076923076923e-06,
-      "loss": 0.3724,
-      "step": 1575
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.312307692307693e-06,
-      "loss": 0.3364,
-      "step": 1600
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.273846153846155e-06,
-      "loss": 0.3661,
-      "step": 1625
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.235384615384615e-06,
-      "loss": 0.3307,
-      "step": 1650
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.196923076923078e-06,
-      "loss": 0.3201,
-      "step": 1675
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.15846153846154e-06,
-      "loss": 0.2973,
-      "step": 1700
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.120000000000002e-06,
-      "loss": 0.3013,
-      "step": 1725
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.081538461538462e-06,
-      "loss": 0.3349,
-      "step": 1750
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.043076923076923e-06,
-      "loss": 0.3244,
-      "step": 1775
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 8.004615384615385e-06,
-      "loss": 0.3331,
-      "step": 1800
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.966153846153847e-06,
-      "loss": 0.2723,
-      "step": 1825
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.927692307692308e-06,
-      "loss": 0.316,
-      "step": 1850
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 7.88923076923077e-06,
-      "loss": 0.2648,
-      "step": 1875
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 7.850769230769232e-06,
-      "loss": 0.2965,
-      "step": 1900
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.812307692307694e-06,
-      "loss": 0.256,
-      "step": 1925
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.773846153846155e-06,
-      "loss": 0.2156,
-      "step": 1950
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.735384615384615e-06,
-      "loss": 0.2418,
-      "step": 1975
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.696923076923077e-06,
-      "loss": 0.2693,
-      "step": 2000
-    },
-    {
-      "epoch": 0.29,
-      "eval_loss": 0.3239877223968506,
-      "eval_runtime": 1817.7748,
-      "eval_samples_per_second": 3.626,
-      "eval_steps_per_second": 0.453,
-      "eval_wer": 22.052330997610273,
-      "step": 2000
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.65846153846154e-06,
-      "loss": 0.2191,
-      "step": 2025
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.620000000000001e-06,
-      "loss": 0.2437,
-      "step": 2050
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 7.581538461538462e-06,
-      "loss": 0.2519,
-      "step": 2075
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 7.544615384615386e-06,
-      "loss": 0.3198,
-      "step": 2100
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 7.5061538461538465e-06,
-      "loss": 0.2708,
-      "step": 2125
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 7.467692307692308e-06,
-      "loss": 0.265,
-      "step": 2150
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 7.42923076923077e-06,
-      "loss": 0.2935,
-      "step": 2175
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 7.390769230769231e-06,
-      "loss": 0.2595,
-      "step": 2200
-    },
-    {
-      "epoch": 0.32,
-      "learning_rate": 7.3523076923076935e-06,
-      "loss": 0.2613,
-      "step": 2225
-    },
-    {
-      "epoch": 0.32,
-      "learning_rate": 7.313846153846155e-06,
-      "loss": 0.2229,
-      "step": 2250
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 7.275384615384616e-06,
-      "loss": 0.2814,
-      "step": 2275
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 7.236923076923078e-06,
-      "loss": 0.2681,
-      "step": 2300
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 7.198461538461539e-06,
-      "loss": 0.2531,
-      "step": 2325
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 7.16e-06,
-      "loss": 0.2104,
-      "step": 2350
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 7.121538461538462e-06,
-      "loss": 0.2294,
-      "step": 2375
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 7.0830769230769235e-06,
-      "loss": 0.2556,
-      "step": 2400
-    },
-    {
-      "epoch": 0.35,
-      "learning_rate": 7.044615384615386e-06,
-      "loss": 0.2185,
-      "step": 2425
-    },
-    {
-      "epoch": 0.35,
-      "learning_rate": 7.006153846153847e-06,
-      "loss": 0.2585,
-      "step": 2450
-    },
-    {
-      "epoch": 0.35,
-      "learning_rate": 6.967692307692308e-06,
-      "loss": 0.2325,
-      "step": 2475
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 6.9292307692307705e-06,
-      "loss": 0.2068,
-      "step": 2500
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 6.890769230769231e-06,
-      "loss": 0.2233,
-      "step": 2525
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 6.852307692307692e-06,
-      "loss": 0.2649,
-      "step": 2550
-    },
-    {
-      "epoch": 0.37,
-      "learning_rate": 6.8138461538461545e-06,
-      "loss": 0.2524,
-      "step": 2575
-    },
-    {
-      "epoch": 0.37,
-      "learning_rate": 6.775384615384616e-06,
-      "loss": 0.2847,
-      "step": 2600
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 6.736923076923078e-06,
-      "loss": 0.1954,
-      "step": 2625
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 6.698461538461539e-06,
-      "loss": 0.2553,
-      "step": 2650
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 6.660000000000001e-06,
-      "loss": 0.2138,
-      "step": 2675
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 6.621538461538463e-06,
-      "loss": 0.2245,
-      "step": 2700
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 6.583076923076923e-06,
-      "loss": 0.2137,
-      "step": 2725
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 6.5446153846153846e-06,
-      "loss": 0.2558,
-      "step": 2750
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 6.506153846153847e-06,
-      "loss": 0.1981,
-      "step": 2775
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 6.467692307692308e-06,
-      "loss": 0.2327,
-      "step": 2800
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 6.42923076923077e-06,
-      "loss": 0.219,
-      "step": 2825
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 6.3907692307692315e-06,
-      "loss": 0.226,
-      "step": 2850
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 6.352307692307693e-06,
-      "loss": 0.2192,
-      "step": 2875
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 6.313846153846155e-06,
-      "loss": 0.2146,
-      "step": 2900
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 6.2753846153846155e-06,
-      "loss": 0.2058,
-      "step": 2925
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 6.236923076923077e-06,
-      "loss": 0.2369,
-      "step": 2950
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 6.198461538461539e-06,
-      "loss": 0.2202,
-      "step": 2975
-    },
-    {
-      "epoch": 0.43,
-      "learning_rate": 6.16e-06,
-      "loss": 0.2228,
-      "step": 3000
-    },
-    {
-      "epoch": 0.43,
-      "eval_loss": 0.27374517917633057,
-      "eval_runtime": 1805.7724,
-      "eval_samples_per_second": 3.65,
-      "eval_steps_per_second": 0.456,
-      "eval_wer": 18.14370772408765,
-      "step": 3000
-    }
-  ],
-  "max_steps": 7000,
-  "num_train_epochs": 9223372036854775807,
-  "total_flos": 1.224725889024e+19,
-  "trial_name": null,
-  "trial_params": null
-}

checkpoint-3000/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e1ca27d9d1bef820c87cfd52d5adb15af5250e1ac4555cd1703a088ad0dad1a4
-size 3643

checkpoint-4000/config.json DELETED Viewed

@@ -1,41 +0,0 @@
-{
-  "_name_or_path": "openai/whisper-medium",
-  "activation_dropout": 0.0,
-  "activation_function": "gelu",
-  "architectures": [
-    "WhisperForConditionalGeneration"
-  ],
-  "attention_dropout": 0.0,
-  "begin_suppress_tokens": [
-    220,
-    50257
-  ],
-  "bos_token_id": 50257,
-  "d_model": 1024,
-  "decoder_attention_heads": 16,
-  "decoder_ffn_dim": 4096,
-  "decoder_layerdrop": 0.0,
-  "decoder_layers": 24,
-  "decoder_start_token_id": 50258,
-  "dropout": 0.0,
-  "encoder_attention_heads": 16,
-  "encoder_ffn_dim": 4096,
-  "encoder_layerdrop": 0.0,
-  "encoder_layers": 24,
-  "eos_token_id": 50257,
-  "forced_decoder_ids": null,
-  "init_std": 0.02,
-  "is_encoder_decoder": true,
-  "max_length": 448,
-  "max_source_positions": 1500,
-  "max_target_positions": 448,
-  "model_type": "whisper",
-  "num_hidden_layers": 24,
-  "num_mel_bins": 80,
-  "pad_token_id": 50257,
-  "scale_embedding": false,
-  "torch_dtype": "float32",
-  "transformers_version": "4.26.0.dev0",
-  "use_cache": false,
-  "vocab_size": 51865
-}

checkpoint-4000/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:1d10d5e2e5766ead361dc8ecf77781538635af5fdd98db487bfde99823ce4a07
-size 6111428695

checkpoint-4000/preprocessor_config.json DELETED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-4000/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:def26fdaf433678a4a7ce858c8c045bcb0081f1a9d18211fd996f65174b4429e
-size 3055754841

checkpoint-4000/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:139a67ed18200d5b28ad0b83b97b2bbd7bf683a055720be06a088fa3bb073509
-size 14575

checkpoint-4000/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:8b27cbf906faccb76347b161e471af6eaccfe3470862a556cf92db01b1d1b35b
-size 557

checkpoint-4000/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:8c8724f1b8669fb50a95fa5a9cd53bb72dbb12e135946c3302c5f49b3cc9f276
-size 627

checkpoint-4000/trainer_state.json DELETED Viewed

@@ -1,1012 +0,0 @@
-{
-  "best_metric": 16.353436753209934,
-  "best_model_checkpoint": "./checkpoint-4000",
-  "epoch": 1.1005714285714285,
-  "global_step": 4000,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.0,
-      "learning_rate": 4.6000000000000004e-07,
-      "loss": 1.4182,
-      "step": 25
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 9.400000000000001e-07,
-      "loss": 1.292,
-      "step": 50
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.44e-06,
-      "loss": 1.0018,
-      "step": 75
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.94e-06,
-      "loss": 0.7765,
-      "step": 100
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.4400000000000004e-06,
-      "loss": 0.7103,
-      "step": 125
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.9400000000000002e-06,
-      "loss": 0.6597,
-      "step": 150
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.44e-06,
-      "loss": 0.6657,
-      "step": 175
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.94e-06,
-      "loss": 0.5853,
-      "step": 200
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 4.440000000000001e-06,
-      "loss": 0.5273,
-      "step": 225
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 4.94e-06,
-      "loss": 0.5979,
-      "step": 250
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.4400000000000004e-06,
-      "loss": 0.5861,
-      "step": 275
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.94e-06,
-      "loss": 0.5085,
-      "step": 300
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.440000000000001e-06,
-      "loss": 0.4827,
-      "step": 325
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.9400000000000005e-06,
-      "loss": 0.4909,
-      "step": 350
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 7.440000000000001e-06,
-      "loss": 0.4651,
-      "step": 375
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 7.94e-06,
-      "loss": 0.494,
-      "step": 400
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.44e-06,
-      "loss": 0.4188,
-      "step": 425
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.94e-06,
-      "loss": 0.3849,
-      "step": 450
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.440000000000001e-06,
-      "loss": 0.4577,
-      "step": 475
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.940000000000001e-06,
-      "loss": 0.4415,
-      "step": 500
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.966153846153847e-06,
-      "loss": 0.4614,
-      "step": 525
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.927692307692309e-06,
-      "loss": 0.4283,
-      "step": 550
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.88923076923077e-06,
-      "loss": 0.4486,
-      "step": 575
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.850769230769231e-06,
-      "loss": 0.4434,
-      "step": 600
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.812307692307694e-06,
-      "loss": 0.4245,
-      "step": 625
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.773846153846154e-06,
-      "loss": 0.4254,
-      "step": 650
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.735384615384616e-06,
-      "loss": 0.4143,
-      "step": 675
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.696923076923078e-06,
-      "loss": 0.4115,
-      "step": 700
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.658461538461539e-06,
-      "loss": 0.3656,
-      "step": 725
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.620000000000001e-06,
-      "loss": 0.4004,
-      "step": 750
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.581538461538462e-06,
-      "loss": 0.388,
-      "step": 775
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.543076923076924e-06,
-      "loss": 0.3665,
-      "step": 800
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.504615384615386e-06,
-      "loss": 0.3777,
-      "step": 825
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.466153846153846e-06,
-      "loss": 0.4338,
-      "step": 850
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.427692307692309e-06,
-      "loss": 0.4017,
-      "step": 875
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.38923076923077e-06,
-      "loss": 0.3757,
-      "step": 900
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.350769230769231e-06,
-      "loss": 0.4084,
-      "step": 925
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.312307692307693e-06,
-      "loss": 0.3821,
-      "step": 950
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.273846153846154e-06,
-      "loss": 0.421,
-      "step": 975
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.235384615384616e-06,
-      "loss": 0.4203,
-      "step": 1000
-    },
-    {
-      "epoch": 0.14,
-      "eval_loss": 0.4127572178840637,
-      "eval_runtime": 1802.5775,
-      "eval_samples_per_second": 3.656,
-      "eval_steps_per_second": 0.457,
-      "eval_wer": 28.265624367127064,
-      "step": 1000
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.196923076923078e-06,
-      "loss": 0.4094,
-      "step": 1025
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.158461538461539e-06,
-      "loss": 0.3674,
-      "step": 1050
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.12e-06,
-      "loss": 0.3613,
-      "step": 1075
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.081538461538463e-06,
-      "loss": 0.3904,
-      "step": 1100
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.043076923076923e-06,
-      "loss": 0.3865,
-      "step": 1125
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.004615384615386e-06,
-      "loss": 0.3677,
-      "step": 1150
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.966153846153846e-06,
-      "loss": 0.3295,
-      "step": 1175
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.927692307692308e-06,
-      "loss": 0.3207,
-      "step": 1200
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.88923076923077e-06,
-      "loss": 0.2817,
-      "step": 1225
-    },
-    {
-      "epoch": 0.18,
-      "learning_rate": 8.850769230769231e-06,
-      "loss": 0.3218,
-      "step": 1250
-    },
-    {
-      "epoch": 0.18,
-      "learning_rate": 8.812307692307693e-06,
-      "loss": 0.3502,
-      "step": 1275
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.773846153846155e-06,
-      "loss": 0.3432,
-      "step": 1300
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.735384615384616e-06,
-      "loss": 0.3244,
-      "step": 1325
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.696923076923078e-06,
-      "loss": 0.2607,
-      "step": 1350
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.658461538461538e-06,
-      "loss": 0.3469,
-      "step": 1375
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.62e-06,
-      "loss": 0.2756,
-      "step": 1400
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.581538461538463e-06,
-      "loss": 0.294,
-      "step": 1425
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.543076923076923e-06,
-      "loss": 0.3915,
-      "step": 1450
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.504615384615385e-06,
-      "loss": 0.3237,
-      "step": 1475
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.466153846153847e-06,
-      "loss": 0.2723,
-      "step": 1500
-    },
-    {
-      "epoch": 0.22,
-      "learning_rate": 8.427692307692308e-06,
-      "loss": 0.2917,
-      "step": 1525
-    },
-    {
-      "epoch": 0.22,
-      "learning_rate": 8.38923076923077e-06,
-      "loss": 0.2921,
-      "step": 1550
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.35076923076923e-06,
-      "loss": 0.3724,
-      "step": 1575
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.312307692307693e-06,
-      "loss": 0.3364,
-      "step": 1600
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.273846153846155e-06,
-      "loss": 0.3661,
-      "step": 1625
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.235384615384615e-06,
-      "loss": 0.3307,
-      "step": 1650
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.196923076923078e-06,
-      "loss": 0.3201,
-      "step": 1675
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.15846153846154e-06,
-      "loss": 0.2973,
-      "step": 1700
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.120000000000002e-06,
-      "loss": 0.3013,
-      "step": 1725
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.081538461538462e-06,
-      "loss": 0.3349,
-      "step": 1750
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.043076923076923e-06,
-      "loss": 0.3244,
-      "step": 1775
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 8.004615384615385e-06,
-      "loss": 0.3331,
-      "step": 1800
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.966153846153847e-06,
-      "loss": 0.2723,
-      "step": 1825
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.927692307692308e-06,
-      "loss": 0.316,
-      "step": 1850
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 7.88923076923077e-06,
-      "loss": 0.2648,
-      "step": 1875
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 7.850769230769232e-06,
-      "loss": 0.2965,
-      "step": 1900
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.812307692307694e-06,
-      "loss": 0.256,
-      "step": 1925
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.773846153846155e-06,
-      "loss": 0.2156,
-      "step": 1950
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.735384615384615e-06,
-      "loss": 0.2418,
-      "step": 1975
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.696923076923077e-06,
-      "loss": 0.2693,
-      "step": 2000
-    },
-    {
-      "epoch": 0.29,
-      "eval_loss": 0.3239877223968506,
-      "eval_runtime": 1817.7748,
-      "eval_samples_per_second": 3.626,
-      "eval_steps_per_second": 0.453,
-      "eval_wer": 22.052330997610273,
-      "step": 2000
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.65846153846154e-06,
-      "loss": 0.2191,
-      "step": 2025
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.620000000000001e-06,
-      "loss": 0.2437,
-      "step": 2050
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 7.581538461538462e-06,
-      "loss": 0.2519,
-      "step": 2075
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 7.544615384615386e-06,
-      "loss": 0.3198,
-      "step": 2100
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 7.5061538461538465e-06,
-      "loss": 0.2708,
-      "step": 2125
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 7.467692307692308e-06,
-      "loss": 0.265,
-      "step": 2150
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 7.42923076923077e-06,
-      "loss": 0.2935,
-      "step": 2175
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 7.390769230769231e-06,
-      "loss": 0.2595,
-      "step": 2200
-    },
-    {
-      "epoch": 0.32,
-      "learning_rate": 7.3523076923076935e-06,
-      "loss": 0.2613,
-      "step": 2225
-    },
-    {
-      "epoch": 0.32,
-      "learning_rate": 7.313846153846155e-06,
-      "loss": 0.2229,
-      "step": 2250
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 7.275384615384616e-06,
-      "loss": 0.2814,
-      "step": 2275
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 7.236923076923078e-06,
-      "loss": 0.2681,
-      "step": 2300
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 7.198461538461539e-06,
-      "loss": 0.2531,
-      "step": 2325
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 7.16e-06,
-      "loss": 0.2104,
-      "step": 2350
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 7.121538461538462e-06,
-      "loss": 0.2294,
-      "step": 2375
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 7.0830769230769235e-06,
-      "loss": 0.2556,
-      "step": 2400
-    },
-    {
-      "epoch": 0.35,
-      "learning_rate": 7.044615384615386e-06,
-      "loss": 0.2185,
-      "step": 2425
-    },
-    {
-      "epoch": 0.35,
-      "learning_rate": 7.006153846153847e-06,
-      "loss": 0.2585,
-      "step": 2450
-    },
-    {
-      "epoch": 0.35,
-      "learning_rate": 6.967692307692308e-06,
-      "loss": 0.2325,
-      "step": 2475
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 6.9292307692307705e-06,
-      "loss": 0.2068,
-      "step": 2500
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 6.890769230769231e-06,
-      "loss": 0.2233,
-      "step": 2525
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 6.852307692307692e-06,
-      "loss": 0.2649,
-      "step": 2550
-    },
-    {
-      "epoch": 0.37,
-      "learning_rate": 6.8138461538461545e-06,
-      "loss": 0.2524,
-      "step": 2575
-    },
-    {
-      "epoch": 0.37,
-      "learning_rate": 6.775384615384616e-06,
-      "loss": 0.2847,
-      "step": 2600
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 6.736923076923078e-06,
-      "loss": 0.1954,
-      "step": 2625
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 6.698461538461539e-06,
-      "loss": 0.2553,
-      "step": 2650
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 6.660000000000001e-06,
-      "loss": 0.2138,
-      "step": 2675
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 6.621538461538463e-06,
-      "loss": 0.2245,
-      "step": 2700
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 6.583076923076923e-06,
-      "loss": 0.2137,
-      "step": 2725
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 6.5446153846153846e-06,
-      "loss": 0.2558,
-      "step": 2750
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 6.506153846153847e-06,
-      "loss": 0.1981,
-      "step": 2775
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 6.467692307692308e-06,
-      "loss": 0.2327,
-      "step": 2800
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 6.42923076923077e-06,
-      "loss": 0.219,
-      "step": 2825
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 6.3907692307692315e-06,
-      "loss": 0.226,
-      "step": 2850
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 6.352307692307693e-06,
-      "loss": 0.2192,
-      "step": 2875
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 6.313846153846155e-06,
-      "loss": 0.2146,
-      "step": 2900
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 6.2753846153846155e-06,
-      "loss": 0.2058,
-      "step": 2925
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 6.236923076923077e-06,
-      "loss": 0.2369,
-      "step": 2950
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 6.198461538461539e-06,
-      "loss": 0.2202,
-      "step": 2975
-    },
-    {
-      "epoch": 0.43,
-      "learning_rate": 6.16e-06,
-      "loss": 0.2228,
-      "step": 3000
-    },
-    {
-      "epoch": 0.43,
-      "eval_loss": 0.27374517917633057,
-      "eval_runtime": 1805.7724,
-      "eval_samples_per_second": 3.65,
-      "eval_steps_per_second": 0.456,
-      "eval_wer": 18.14370772408765,
-      "step": 3000
-    },
-    {
-      "epoch": 0.43,
-      "learning_rate": 6.1215384615384625e-06,
-      "loss": 0.2029,
-      "step": 3025
-    },
-    {
-      "epoch": 0.44,
-      "learning_rate": 6.083076923076924e-06,
-      "loss": 0.2085,
-      "step": 3050
-    },
-    {
-      "epoch": 0.44,
-      "learning_rate": 6.044615384615385e-06,
-      "loss": 0.196,
-      "step": 3075
-    },
-    {
-      "epoch": 0.44,
-      "learning_rate": 6.006153846153847e-06,
-      "loss": 0.1999,
-      "step": 3100
-    },
-    {
-      "epoch": 0.45,
-      "learning_rate": 5.967692307692308e-06,
-      "loss": 0.2076,
-      "step": 3125
-    },
-    {
-      "epoch": 0.45,
-      "learning_rate": 5.929230769230769e-06,
-      "loss": 0.1999,
-      "step": 3150
-    },
-    {
-      "epoch": 0.45,
-      "learning_rate": 5.890769230769231e-06,
-      "loss": 0.2361,
-      "step": 3175
-    },
-    {
-      "epoch": 0.46,
-      "learning_rate": 5.8523076923076926e-06,
-      "loss": 0.2003,
-      "step": 3200
-    },
-    {
-      "epoch": 0.46,
-      "learning_rate": 5.813846153846155e-06,
-      "loss": 0.249,
-      "step": 3225
-    },
-    {
-      "epoch": 0.46,
-      "learning_rate": 5.775384615384616e-06,
-      "loss": 0.2724,
-      "step": 3250
-    },
-    {
-      "epoch": 0.47,
-      "learning_rate": 5.736923076923077e-06,
-      "loss": 0.2001,
-      "step": 3275
-    },
-    {
-      "epoch": 1.0,
-      "learning_rate": 5.6984615384615395e-06,
-      "loss": 0.2355,
-      "step": 3300
-    },
-    {
-      "epoch": 1.0,
-      "learning_rate": 5.66e-06,
-      "loss": 0.2297,
-      "step": 3325
-    },
-    {
-      "epoch": 1.01,
-      "learning_rate": 5.621538461538461e-06,
-      "loss": 0.2265,
-      "step": 3350
-    },
-    {
-      "epoch": 1.01,
-      "learning_rate": 5.5830769230769235e-06,
-      "loss": 0.21,
-      "step": 3375
-    },
-    {
-      "epoch": 1.01,
-      "learning_rate": 5.544615384615385e-06,
-      "loss": 0.1944,
-      "step": 3400
-    },
-    {
-      "epoch": 1.02,
-      "learning_rate": 5.506153846153847e-06,
-      "loss": 0.1844,
-      "step": 3425
-    },
-    {
-      "epoch": 1.02,
-      "learning_rate": 5.467692307692308e-06,
-      "loss": 0.1774,
-      "step": 3450
-    },
-    {
-      "epoch": 1.03,
-      "learning_rate": 5.42923076923077e-06,
-      "loss": 0.1688,
-      "step": 3475
-    },
-    {
-      "epoch": 1.03,
-      "learning_rate": 5.390769230769232e-06,
-      "loss": 0.1473,
-      "step": 3500
-    },
-    {
-      "epoch": 1.03,
-      "learning_rate": 5.352307692307692e-06,
-      "loss": 0.1743,
-      "step": 3525
-    },
-    {
-      "epoch": 1.04,
-      "learning_rate": 5.313846153846154e-06,
-      "loss": 0.1759,
-      "step": 3550
-    },
-    {
-      "epoch": 1.04,
-      "learning_rate": 5.275384615384616e-06,
-      "loss": 0.1507,
-      "step": 3575
-    },
-    {
-      "epoch": 1.04,
-      "learning_rate": 5.236923076923077e-06,
-      "loss": 0.1556,
-      "step": 3600
-    },
-    {
-      "epoch": 1.05,
-      "learning_rate": 5.198461538461539e-06,
-      "loss": 0.1545,
-      "step": 3625
-    },
-    {
-      "epoch": 1.05,
-      "learning_rate": 5.1600000000000006e-06,
-      "loss": 0.1143,
-      "step": 3650
-    },
-    {
-      "epoch": 1.05,
-      "learning_rate": 5.121538461538462e-06,
-      "loss": 0.1168,
-      "step": 3675
-    },
-    {
-      "epoch": 1.06,
-      "learning_rate": 5.083076923076924e-06,
-      "loss": 0.1095,
-      "step": 3700
-    },
-    {
-      "epoch": 1.06,
-      "learning_rate": 5.044615384615385e-06,
-      "loss": 0.1098,
-      "step": 3725
-    },
-    {
-      "epoch": 1.06,
-      "learning_rate": 5.006153846153846e-06,
-      "loss": 0.102,
-      "step": 3750
-    },
-    {
-      "epoch": 1.07,
-      "learning_rate": 4.967692307692308e-06,
-      "loss": 0.1263,
-      "step": 3775
-    },
-    {
-      "epoch": 1.07,
-      "learning_rate": 4.929230769230769e-06,
-      "loss": 0.093,
-      "step": 3800
-    },
-    {
-      "epoch": 1.08,
-      "learning_rate": 4.8907692307692315e-06,
-      "loss": 0.1163,
-      "step": 3825
-    },
-    {
-      "epoch": 1.08,
-      "learning_rate": 4.852307692307693e-06,
-      "loss": 0.1005,
-      "step": 3850
-    },
-    {
-      "epoch": 1.08,
-      "learning_rate": 4.813846153846154e-06,
-      "loss": 0.1036,
-      "step": 3875
-    },
-    {
-      "epoch": 1.09,
-      "learning_rate": 4.7753846153846155e-06,
-      "loss": 0.1289,
-      "step": 3900
-    },
-    {
-      "epoch": 1.09,
-      "learning_rate": 4.736923076923078e-06,
-      "loss": 0.1238,
-      "step": 3925
-    },
-    {
-      "epoch": 1.09,
-      "learning_rate": 4.698461538461539e-06,
-      "loss": 0.1218,
-      "step": 3950
-    },
-    {
-      "epoch": 1.1,
-      "learning_rate": 4.66e-06,
-      "loss": 0.1223,
-      "step": 3975
-    },
-    {
-      "epoch": 1.1,
-      "learning_rate": 4.621538461538462e-06,
-      "loss": 0.1002,
-      "step": 4000
-    },
-    {
-      "epoch": 1.1,
-      "eval_loss": 0.2553846836090088,
-      "eval_runtime": 1819.1705,
-      "eval_samples_per_second": 3.623,
-      "eval_steps_per_second": 0.453,
-      "eval_wer": 16.353436753209934,
-      "step": 4000
-    }
-  ],
-  "max_steps": 7000,
-  "num_train_epochs": 9223372036854775807,
-  "total_flos": 1.632763731050496e+19,
-  "trial_name": null,
-  "trial_params": null
-}

checkpoint-4000/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e1ca27d9d1bef820c87cfd52d5adb15af5250e1ac4555cd1703a088ad0dad1a4
-size 3643

checkpoint-5000/config.json DELETED Viewed

@@ -1,41 +0,0 @@
-{
-  "_name_or_path": "openai/whisper-medium",
-  "activation_dropout": 0.0,
-  "activation_function": "gelu",
-  "architectures": [
-    "WhisperForConditionalGeneration"
-  ],
-  "attention_dropout": 0.0,
-  "begin_suppress_tokens": [
-    220,
-    50257
-  ],
-  "bos_token_id": 50257,
-  "d_model": 1024,
-  "decoder_attention_heads": 16,
-  "decoder_ffn_dim": 4096,
-  "decoder_layerdrop": 0.0,
-  "decoder_layers": 24,
-  "decoder_start_token_id": 50258,
-  "dropout": 0.0,
-  "encoder_attention_heads": 16,
-  "encoder_ffn_dim": 4096,
-  "encoder_layerdrop": 0.0,
-  "encoder_layers": 24,
-  "eos_token_id": 50257,
-  "forced_decoder_ids": null,
-  "init_std": 0.02,
-  "is_encoder_decoder": true,
-  "max_length": 448,
-  "max_source_positions": 1500,
-  "max_target_positions": 448,
-  "model_type": "whisper",
-  "num_hidden_layers": 24,
-  "num_mel_bins": 80,
-  "pad_token_id": 50257,
-  "scale_embedding": false,
-  "torch_dtype": "float32",
-  "transformers_version": "4.26.0.dev0",
-  "use_cache": false,
-  "vocab_size": 51865
-}

checkpoint-5000/optimizer.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:dae73746a9cbfc8af8231a105d0ff0c0a1569e44353a8f7f629de550c1b98935
-size 6111428695

checkpoint-5000/preprocessor_config.json DELETED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-5000/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:cd978f2c702bba55edafb2fe89ef7706d888507a7bf7803905115ee1cbeee805
-size 3055754841

checkpoint-5000/rng_state.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:507ba841a78b27a21beeb8be24ea95ea58bc2145f1c0364911d4f242151bdde4
-size 14511

checkpoint-5000/scaler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:949ca9c3bcb3a1db4317303e71acb4df5237388410fcf06e1c212003108bf76f
-size 557

checkpoint-5000/scheduler.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:b6704f8857293535a5120dbc970e54bdc93a29e478b654c1b6cc889e897b72c1
-size 627

checkpoint-5000/trainer_state.json DELETED Viewed

@@ -1,1261 +0,0 @@
-{
-  "best_metric": 14.787962250394912,
-  "best_model_checkpoint": "./checkpoint-5000",
-  "epoch": 1.2434285714285713,
-  "global_step": 5000,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.0,
-      "learning_rate": 4.6000000000000004e-07,
-      "loss": 1.4182,
-      "step": 25
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 9.400000000000001e-07,
-      "loss": 1.292,
-      "step": 50
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.44e-06,
-      "loss": 1.0018,
-      "step": 75
-    },
-    {
-      "epoch": 0.01,
-      "learning_rate": 1.94e-06,
-      "loss": 0.7765,
-      "step": 100
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.4400000000000004e-06,
-      "loss": 0.7103,
-      "step": 125
-    },
-    {
-      "epoch": 0.02,
-      "learning_rate": 2.9400000000000002e-06,
-      "loss": 0.6597,
-      "step": 150
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.44e-06,
-      "loss": 0.6657,
-      "step": 175
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.94e-06,
-      "loss": 0.5853,
-      "step": 200
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 4.440000000000001e-06,
-      "loss": 0.5273,
-      "step": 225
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 4.94e-06,
-      "loss": 0.5979,
-      "step": 250
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.4400000000000004e-06,
-      "loss": 0.5861,
-      "step": 275
-    },
-    {
-      "epoch": 0.04,
-      "learning_rate": 5.94e-06,
-      "loss": 0.5085,
-      "step": 300
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.440000000000001e-06,
-      "loss": 0.4827,
-      "step": 325
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 6.9400000000000005e-06,
-      "loss": 0.4909,
-      "step": 350
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 7.440000000000001e-06,
-      "loss": 0.4651,
-      "step": 375
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 7.94e-06,
-      "loss": 0.494,
-      "step": 400
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.44e-06,
-      "loss": 0.4188,
-      "step": 425
-    },
-    {
-      "epoch": 0.06,
-      "learning_rate": 8.94e-06,
-      "loss": 0.3849,
-      "step": 450
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.440000000000001e-06,
-      "loss": 0.4577,
-      "step": 475
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.940000000000001e-06,
-      "loss": 0.4415,
-      "step": 500
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 9.966153846153847e-06,
-      "loss": 0.4614,
-      "step": 525
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.927692307692309e-06,
-      "loss": 0.4283,
-      "step": 550
-    },
-    {
-      "epoch": 0.08,
-      "learning_rate": 9.88923076923077e-06,
-      "loss": 0.4486,
-      "step": 575
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.850769230769231e-06,
-      "loss": 0.4434,
-      "step": 600
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.812307692307694e-06,
-      "loss": 0.4245,
-      "step": 625
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 9.773846153846154e-06,
-      "loss": 0.4254,
-      "step": 650
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.735384615384616e-06,
-      "loss": 0.4143,
-      "step": 675
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.696923076923078e-06,
-      "loss": 0.4115,
-      "step": 700
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 9.658461538461539e-06,
-      "loss": 0.3656,
-      "step": 725
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.620000000000001e-06,
-      "loss": 0.4004,
-      "step": 750
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.581538461538462e-06,
-      "loss": 0.388,
-      "step": 775
-    },
-    {
-      "epoch": 0.11,
-      "learning_rate": 9.543076923076924e-06,
-      "loss": 0.3665,
-      "step": 800
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.504615384615386e-06,
-      "loss": 0.3777,
-      "step": 825
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.466153846153846e-06,
-      "loss": 0.4338,
-      "step": 850
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 9.427692307692309e-06,
-      "loss": 0.4017,
-      "step": 875
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.38923076923077e-06,
-      "loss": 0.3757,
-      "step": 900
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 9.350769230769231e-06,
-      "loss": 0.4084,
-      "step": 925
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.312307692307693e-06,
-      "loss": 0.3821,
-      "step": 950
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.273846153846154e-06,
-      "loss": 0.421,
-      "step": 975
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 9.235384615384616e-06,
-      "loss": 0.4203,
-      "step": 1000
-    },
-    {
-      "epoch": 0.14,
-      "eval_loss": 0.4127572178840637,
-      "eval_runtime": 1802.5775,
-      "eval_samples_per_second": 3.656,
-      "eval_steps_per_second": 0.457,
-      "eval_wer": 28.265624367127064,
-      "step": 1000
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.196923076923078e-06,
-      "loss": 0.4094,
-      "step": 1025
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.158461538461539e-06,
-      "loss": 0.3674,
-      "step": 1050
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 9.12e-06,
-      "loss": 0.3613,
-      "step": 1075
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.081538461538463e-06,
-      "loss": 0.3904,
-      "step": 1100
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.043076923076923e-06,
-      "loss": 0.3865,
-      "step": 1125
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 9.004615384615386e-06,
-      "loss": 0.3677,
-      "step": 1150
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.966153846153846e-06,
-      "loss": 0.3295,
-      "step": 1175
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.927692307692308e-06,
-      "loss": 0.3207,
-      "step": 1200
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 8.88923076923077e-06,
-      "loss": 0.2817,
-      "step": 1225
-    },
-    {
-      "epoch": 0.18,
-      "learning_rate": 8.850769230769231e-06,
-      "loss": 0.3218,
-      "step": 1250
-    },
-    {
-      "epoch": 0.18,
-      "learning_rate": 8.812307692307693e-06,
-      "loss": 0.3502,
-      "step": 1275
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.773846153846155e-06,
-      "loss": 0.3432,
-      "step": 1300
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.735384615384616e-06,
-      "loss": 0.3244,
-      "step": 1325
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 8.696923076923078e-06,
-      "loss": 0.2607,
-      "step": 1350
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.658461538461538e-06,
-      "loss": 0.3469,
-      "step": 1375
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.62e-06,
-      "loss": 0.2756,
-      "step": 1400
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 8.581538461538463e-06,
-      "loss": 0.294,
-      "step": 1425
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.543076923076923e-06,
-      "loss": 0.3915,
-      "step": 1450
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.504615384615385e-06,
-      "loss": 0.3237,
-      "step": 1475
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 8.466153846153847e-06,
-      "loss": 0.2723,
-      "step": 1500
-    },
-    {
-      "epoch": 0.22,
-      "learning_rate": 8.427692307692308e-06,
-      "loss": 0.2917,
-      "step": 1525
-    },
-    {
-      "epoch": 0.22,
-      "learning_rate": 8.38923076923077e-06,
-      "loss": 0.2921,
-      "step": 1550
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.35076923076923e-06,
-      "loss": 0.3724,
-      "step": 1575
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.312307692307693e-06,
-      "loss": 0.3364,
-      "step": 1600
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 8.273846153846155e-06,
-      "loss": 0.3661,
-      "step": 1625
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.235384615384615e-06,
-      "loss": 0.3307,
-      "step": 1650
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.196923076923078e-06,
-      "loss": 0.3201,
-      "step": 1675
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 8.15846153846154e-06,
-      "loss": 0.2973,
-      "step": 1700
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.120000000000002e-06,
-      "loss": 0.3013,
-      "step": 1725
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.081538461538462e-06,
-      "loss": 0.3349,
-      "step": 1750
-    },
-    {
-      "epoch": 0.25,
-      "learning_rate": 8.043076923076923e-06,
-      "loss": 0.3244,
-      "step": 1775
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 8.004615384615385e-06,
-      "loss": 0.3331,
-      "step": 1800
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.966153846153847e-06,
-      "loss": 0.2723,
-      "step": 1825
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 7.927692307692308e-06,
-      "loss": 0.316,
-      "step": 1850
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 7.88923076923077e-06,
-      "loss": 0.2648,
-      "step": 1875
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 7.850769230769232e-06,
-      "loss": 0.2965,
-      "step": 1900
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.812307692307694e-06,
-      "loss": 0.256,
-      "step": 1925
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.773846153846155e-06,
-      "loss": 0.2156,
-      "step": 1950
-    },
-    {
-      "epoch": 0.28,
-      "learning_rate": 7.735384615384615e-06,
-      "loss": 0.2418,
-      "step": 1975
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.696923076923077e-06,
-      "loss": 0.2693,
-      "step": 2000
-    },
-    {
-      "epoch": 0.29,
-      "eval_loss": 0.3239877223968506,
-      "eval_runtime": 1817.7748,
-      "eval_samples_per_second": 3.626,
-      "eval_steps_per_second": 0.453,
-      "eval_wer": 22.052330997610273,
-      "step": 2000
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.65846153846154e-06,
-      "loss": 0.2191,
-      "step": 2025
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 7.620000000000001e-06,
-      "loss": 0.2437,
-      "step": 2050
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 7.581538461538462e-06,
-      "loss": 0.2519,
-      "step": 2075
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 7.544615384615386e-06,
-      "loss": 0.3198,
-      "step": 2100
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 7.5061538461538465e-06,
-      "loss": 0.2708,
-      "step": 2125
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 7.467692307692308e-06,
-      "loss": 0.265,
-      "step": 2150
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 7.42923076923077e-06,
-      "loss": 0.2935,
-      "step": 2175
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 7.390769230769231e-06,
-      "loss": 0.2595,
-      "step": 2200
-    },
-    {
-      "epoch": 0.32,
-      "learning_rate": 7.3523076923076935e-06,
-      "loss": 0.2613,
-      "step": 2225
-    },
-    {
-      "epoch": 0.32,
-      "learning_rate": 7.313846153846155e-06,
-      "loss": 0.2229,
-      "step": 2250
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 7.275384615384616e-06,
-      "loss": 0.2814,
-      "step": 2275
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 7.236923076923078e-06,
-      "loss": 0.2681,
-      "step": 2300
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 7.198461538461539e-06,
-      "loss": 0.2531,
-      "step": 2325
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 7.16e-06,
-      "loss": 0.2104,
-      "step": 2350
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 7.121538461538462e-06,
-      "loss": 0.2294,
-      "step": 2375
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 7.0830769230769235e-06,
-      "loss": 0.2556,
-      "step": 2400
-    },
-    {
-      "epoch": 0.35,
-      "learning_rate": 7.044615384615386e-06,
-      "loss": 0.2185,
-      "step": 2425
-    },
-    {
-      "epoch": 0.35,
-      "learning_rate": 7.006153846153847e-06,
-      "loss": 0.2585,
-      "step": 2450
-    },
-    {
-      "epoch": 0.35,
-      "learning_rate": 6.967692307692308e-06,
-      "loss": 0.2325,
-      "step": 2475
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 6.9292307692307705e-06,
-      "loss": 0.2068,
-      "step": 2500
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 6.890769230769231e-06,
-      "loss": 0.2233,
-      "step": 2525
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 6.852307692307692e-06,
-      "loss": 0.2649,
-      "step": 2550
-    },
-    {
-      "epoch": 0.37,
-      "learning_rate": 6.8138461538461545e-06,
-      "loss": 0.2524,
-      "step": 2575
-    },
-    {
-      "epoch": 0.37,
-      "learning_rate": 6.775384615384616e-06,
-      "loss": 0.2847,
-      "step": 2600
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 6.736923076923078e-06,
-      "loss": 0.1954,
-      "step": 2625
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 6.698461538461539e-06,
-      "loss": 0.2553,
-      "step": 2650
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 6.660000000000001e-06,
-      "loss": 0.2138,
-      "step": 2675
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 6.621538461538463e-06,
-      "loss": 0.2245,
-      "step": 2700
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 6.583076923076923e-06,
-      "loss": 0.2137,
-      "step": 2725
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 6.5446153846153846e-06,
-      "loss": 0.2558,
-      "step": 2750
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 6.506153846153847e-06,
-      "loss": 0.1981,
-      "step": 2775
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 6.467692307692308e-06,
-      "loss": 0.2327,
-      "step": 2800
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 6.42923076923077e-06,
-      "loss": 0.219,
-      "step": 2825
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 6.3907692307692315e-06,
-      "loss": 0.226,
-      "step": 2850
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 6.352307692307693e-06,
-      "loss": 0.2192,
-      "step": 2875
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 6.313846153846155e-06,
-      "loss": 0.2146,
-      "step": 2900
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 6.2753846153846155e-06,
-      "loss": 0.2058,
-      "step": 2925
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 6.236923076923077e-06,
-      "loss": 0.2369,
-      "step": 2950
-    },
-    {
-      "epoch": 0.42,
-      "learning_rate": 6.198461538461539e-06,
-      "loss": 0.2202,
-      "step": 2975
-    },
-    {
-      "epoch": 0.43,
-      "learning_rate": 6.16e-06,
-      "loss": 0.2228,
-      "step": 3000
-    },
-    {
-      "epoch": 0.43,
-      "eval_loss": 0.27374517917633057,
-      "eval_runtime": 1805.7724,
-      "eval_samples_per_second": 3.65,
-      "eval_steps_per_second": 0.456,
-      "eval_wer": 18.14370772408765,
-      "step": 3000
-    },
-    {
-      "epoch": 0.43,
-      "learning_rate": 6.1215384615384625e-06,
-      "loss": 0.2029,
-      "step": 3025
-    },
-    {
-      "epoch": 0.44,
-      "learning_rate": 6.083076923076924e-06,
-      "loss": 0.2085,
-      "step": 3050
-    },
-    {
-      "epoch": 0.44,
-      "learning_rate": 6.044615384615385e-06,
-      "loss": 0.196,
-      "step": 3075
-    },
-    {
-      "epoch": 0.44,
-      "learning_rate": 6.006153846153847e-06,
-      "loss": 0.1999,
-      "step": 3100
-    },
-    {
-      "epoch": 0.45,
-      "learning_rate": 5.967692307692308e-06,
-      "loss": 0.2076,
-      "step": 3125
-    },
-    {
-      "epoch": 0.45,
-      "learning_rate": 5.929230769230769e-06,
-      "loss": 0.1999,
-      "step": 3150
-    },
-    {
-      "epoch": 0.45,
-      "learning_rate": 5.890769230769231e-06,
-      "loss": 0.2361,
-      "step": 3175
-    },
-    {
-      "epoch": 0.46,
-      "learning_rate": 5.8523076923076926e-06,
-      "loss": 0.2003,
-      "step": 3200
-    },
-    {
-      "epoch": 0.46,
-      "learning_rate": 5.813846153846155e-06,
-      "loss": 0.249,
-      "step": 3225
-    },
-    {
-      "epoch": 0.46,
-      "learning_rate": 5.775384615384616e-06,
-      "loss": 0.2724,
-      "step": 3250
-    },
-    {
-      "epoch": 0.47,
-      "learning_rate": 5.736923076923077e-06,
-      "loss": 0.2001,
-      "step": 3275
-    },
-    {
-      "epoch": 1.0,
-      "learning_rate": 5.6984615384615395e-06,
-      "loss": 0.2355,
-      "step": 3300
-    },
-    {
-      "epoch": 1.0,
-      "learning_rate": 5.66e-06,
-      "loss": 0.2297,
-      "step": 3325
-    },
-    {
-      "epoch": 1.01,
-      "learning_rate": 5.621538461538461e-06,
-      "loss": 0.2265,
-      "step": 3350
-    },
-    {
-      "epoch": 1.01,
-      "learning_rate": 5.5830769230769235e-06,
-      "loss": 0.21,
-      "step": 3375
-    },
-    {
-      "epoch": 1.01,
-      "learning_rate": 5.544615384615385e-06,
-      "loss": 0.1944,
-      "step": 3400
-    },
-    {
-      "epoch": 1.02,
-      "learning_rate": 5.506153846153847e-06,
-      "loss": 0.1844,
-      "step": 3425
-    },
-    {
-      "epoch": 1.02,
-      "learning_rate": 5.467692307692308e-06,
-      "loss": 0.1774,
-      "step": 3450
-    },
-    {
-      "epoch": 1.03,
-      "learning_rate": 5.42923076923077e-06,
-      "loss": 0.1688,
-      "step": 3475
-    },
-    {
-      "epoch": 1.03,
-      "learning_rate": 5.390769230769232e-06,
-      "loss": 0.1473,
-      "step": 3500
-    },
-    {
-      "epoch": 1.03,
-      "learning_rate": 5.352307692307692e-06,
-      "loss": 0.1743,
-      "step": 3525
-    },
-    {
-      "epoch": 1.04,
-      "learning_rate": 5.313846153846154e-06,
-      "loss": 0.1759,
-      "step": 3550
-    },
-    {
-      "epoch": 1.04,
-      "learning_rate": 5.275384615384616e-06,
-      "loss": 0.1507,
-      "step": 3575
-    },
-    {
-      "epoch": 1.04,
-      "learning_rate": 5.236923076923077e-06,
-      "loss": 0.1556,
-      "step": 3600
-    },
-    {
-      "epoch": 1.05,
-      "learning_rate": 5.198461538461539e-06,
-      "loss": 0.1545,
-      "step": 3625
-    },
-    {
-      "epoch": 1.05,
-      "learning_rate": 5.1600000000000006e-06,
-      "loss": 0.1143,
-      "step": 3650
-    },
-    {
-      "epoch": 1.05,
-      "learning_rate": 5.121538461538462e-06,
-      "loss": 0.1168,
-      "step": 3675
-    },
-    {
-      "epoch": 1.06,
-      "learning_rate": 5.083076923076924e-06,
-      "loss": 0.1095,
-      "step": 3700
-    },
-    {
-      "epoch": 1.06,
-      "learning_rate": 5.044615384615385e-06,
-      "loss": 0.1098,
-      "step": 3725
-    },
-    {
-      "epoch": 1.06,
-      "learning_rate": 5.006153846153846e-06,
-      "loss": 0.102,
-      "step": 3750
-    },
-    {
-      "epoch": 1.07,
-      "learning_rate": 4.967692307692308e-06,
-      "loss": 0.1263,
-      "step": 3775
-    },
-    {
-      "epoch": 1.07,
-      "learning_rate": 4.929230769230769e-06,
-      "loss": 0.093,
-      "step": 3800
-    },
-    {
-      "epoch": 1.08,
-      "learning_rate": 4.8907692307692315e-06,
-      "loss": 0.1163,
-      "step": 3825
-    },
-    {
-      "epoch": 1.08,
-      "learning_rate": 4.852307692307693e-06,
-      "loss": 0.1005,
-      "step": 3850
-    },
-    {
-      "epoch": 1.08,
-      "learning_rate": 4.813846153846154e-06,
-      "loss": 0.1036,
-      "step": 3875
-    },
-    {
-      "epoch": 1.09,
-      "learning_rate": 4.7753846153846155e-06,
-      "loss": 0.1289,
-      "step": 3900
-    },
-    {
-      "epoch": 1.09,
-      "learning_rate": 4.736923076923078e-06,
-      "loss": 0.1238,
-      "step": 3925
-    },
-    {
-      "epoch": 1.09,
-      "learning_rate": 4.698461538461539e-06,
-      "loss": 0.1218,
-      "step": 3950
-    },
-    {
-      "epoch": 1.1,
-      "learning_rate": 4.66e-06,
-      "loss": 0.1223,
-      "step": 3975
-    },
-    {
-      "epoch": 1.1,
-      "learning_rate": 4.621538461538462e-06,
-      "loss": 0.1002,
-      "step": 4000
-    },
-    {
-      "epoch": 1.1,
-      "eval_loss": 0.2553846836090088,
-      "eval_runtime": 1819.1705,
-      "eval_samples_per_second": 3.623,
-      "eval_steps_per_second": 0.453,
-      "eval_wer": 16.353436753209934,
-      "step": 4000
-    },
-    {
-      "epoch": 1.1,
-      "learning_rate": 4.583076923076924e-06,
-      "loss": 0.1,
-      "step": 4025
-    },
-    {
-      "epoch": 1.11,
-      "learning_rate": 4.544615384615385e-06,
-      "loss": 0.0925,
-      "step": 4050
-    },
-    {
-      "epoch": 1.11,
-      "learning_rate": 4.506153846153846e-06,
-      "loss": 0.1064,
-      "step": 4075
-    },
-    {
-      "epoch": 1.11,
-      "learning_rate": 4.467692307692308e-06,
-      "loss": 0.1127,
-      "step": 4100
-    },
-    {
-      "epoch": 1.12,
-      "learning_rate": 4.42923076923077e-06,
-      "loss": 0.1036,
-      "step": 4125
-    },
-    {
-      "epoch": 1.12,
-      "learning_rate": 4.392307692307693e-06,
-      "loss": 0.091,
-      "step": 4150
-    },
-    {
-      "epoch": 1.13,
-      "learning_rate": 4.353846153846154e-06,
-      "loss": 0.105,
-      "step": 4175
-    },
-    {
-      "epoch": 1.13,
-      "learning_rate": 4.315384615384616e-06,
-      "loss": 0.1147,
-      "step": 4200
-    },
-    {
-      "epoch": 1.13,
-      "learning_rate": 4.276923076923078e-06,
-      "loss": 0.0897,
-      "step": 4225
-    },
-    {
-      "epoch": 1.14,
-      "learning_rate": 4.238461538461539e-06,
-      "loss": 0.1268,
-      "step": 4250
-    },
-    {
-      "epoch": 1.14,
-      "learning_rate": 4.2000000000000004e-06,
-      "loss": 0.1129,
-      "step": 4275
-    },
-    {
-      "epoch": 1.14,
-      "learning_rate": 4.161538461538462e-06,
-      "loss": 0.1041,
-      "step": 4300
-    },
-    {
-      "epoch": 1.15,
-      "learning_rate": 4.123076923076924e-06,
-      "loss": 0.1061,
-      "step": 4325
-    },
-    {
-      "epoch": 1.15,
-      "learning_rate": 4.084615384615385e-06,
-      "loss": 0.1059,
-      "step": 4350
-    },
-    {
-      "epoch": 1.15,
-      "learning_rate": 4.0461538461538466e-06,
-      "loss": 0.0818,
-      "step": 4375
-    },
-    {
-      "epoch": 1.16,
-      "learning_rate": 4.007692307692308e-06,
-      "loss": 0.087,
-      "step": 4400
-    },
-    {
-      "epoch": 1.16,
-      "learning_rate": 3.96923076923077e-06,
-      "loss": 0.0835,
-      "step": 4425
-    },
-    {
-      "epoch": 1.16,
-      "learning_rate": 3.930769230769231e-06,
-      "loss": 0.0713,
-      "step": 4450
-    },
-    {
-      "epoch": 1.17,
-      "learning_rate": 3.892307692307693e-06,
-      "loss": 0.0792,
-      "step": 4475
-    },
-    {
-      "epoch": 1.17,
-      "learning_rate": 3.853846153846154e-06,
-      "loss": 0.0799,
-      "step": 4500
-    },
-    {
-      "epoch": 1.18,
-      "learning_rate": 3.815384615384616e-06,
-      "loss": 0.0755,
-      "step": 4525
-    },
-    {
-      "epoch": 1.18,
-      "learning_rate": 3.7769230769230775e-06,
-      "loss": 0.0703,
-      "step": 4550
-    },
-    {
-      "epoch": 1.18,
-      "learning_rate": 3.7384615384615384e-06,
-      "loss": 0.11,
-      "step": 4575
-    },
-    {
-      "epoch": 1.19,
-      "learning_rate": 3.7e-06,
-      "loss": 0.0891,
-      "step": 4600
-    },
-    {
-      "epoch": 1.19,
-      "learning_rate": 3.661538461538462e-06,
-      "loss": 0.0757,
-      "step": 4625
-    },
-    {
-      "epoch": 1.19,
-      "learning_rate": 3.6230769230769236e-06,
-      "loss": 0.0699,
-      "step": 4650
-    },
-    {
-      "epoch": 1.2,
-      "learning_rate": 3.5846153846153845e-06,
-      "loss": 0.0839,
-      "step": 4675
-    },
-    {
-      "epoch": 1.2,
-      "learning_rate": 3.5461538461538463e-06,
-      "loss": 0.1029,
-      "step": 4700
-    },
-    {
-      "epoch": 1.2,
-      "learning_rate": 3.507692307692308e-06,
-      "loss": 0.0806,
-      "step": 4725
-    },
-    {
-      "epoch": 1.21,
-      "learning_rate": 3.4692307692307698e-06,
-      "loss": 0.0808,
-      "step": 4750
-    },
-    {
-      "epoch": 1.21,
-      "learning_rate": 3.4307692307692307e-06,
-      "loss": 0.0801,
-      "step": 4775
-    },
-    {
-      "epoch": 1.21,
-      "learning_rate": 3.3923076923076924e-06,
-      "loss": 0.0705,
-      "step": 4800
-    },
-    {
-      "epoch": 1.22,
-      "learning_rate": 3.353846153846154e-06,
-      "loss": 0.0711,
-      "step": 4825
-    },
-    {
-      "epoch": 1.22,
-      "learning_rate": 3.315384615384616e-06,
-      "loss": 0.0721,
-      "step": 4850
-    },
-    {
-      "epoch": 1.23,
-      "learning_rate": 3.276923076923077e-06,
-      "loss": 0.0806,
-      "step": 4875
-    },
-    {
-      "epoch": 1.23,
-      "learning_rate": 3.2384615384615385e-06,
-      "loss": 0.0816,
-      "step": 4900
-    },
-    {
-      "epoch": 1.23,
-      "learning_rate": 3.2000000000000003e-06,
-      "loss": 0.078,
-      "step": 4925
-    },
-    {
-      "epoch": 1.24,
-      "learning_rate": 3.161538461538462e-06,
-      "loss": 0.0858,
-      "step": 4950
-    },
-    {
-      "epoch": 1.24,
-      "learning_rate": 3.123076923076923e-06,
-      "loss": 0.0948,
-      "step": 4975
-    },
-    {
-      "epoch": 1.24,
-      "learning_rate": 3.0846153846153847e-06,
-      "loss": 0.0863,
-      "step": 5000
-    },
-    {
-      "epoch": 1.24,
-      "eval_loss": 0.23512449860572815,
-      "eval_runtime": 1865.1318,
-      "eval_samples_per_second": 3.534,
-      "eval_steps_per_second": 0.442,
-      "eval_wer": 14.787962250394912,
-      "step": 5000
-    }
-  ],
-  "max_steps": 7000,
-  "num_train_epochs": 9223372036854775807,
-  "total_flos": 2.041005694058496e+19,
-  "trial_name": null,
-  "trial_params": null
-}

checkpoint-5000/training_args.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e1ca27d9d1bef820c87cfd52d5adb15af5250e1ac4555cd1703a088ad0dad1a4
-size 3643

nohup.out DELETED Viewed

The diff for this file is too large to render. See raw diff

run.sh CHANGED Viewed

@@ -6,18 +6,18 @@ python run_speech_recognition_seq2seq_streaming.py \
 	--train_split_name="train+validation" \
 	--eval_split_name="test" \
 	--model_index_name="Whisper Small Basque" \
-	--max_steps="7000" \
 	--output_dir="./" \
 	--per_device_train_batch_size="4" \
 	--per_device_eval_batch_size="8" \
 	--gradient_accumulation_steps="1" \
 	--logging_steps="25" \
-	--learning_rate="1e-5" \
 	--warmup_steps="500" \
 	--evaluation_strategy="steps" \
 	--eval_steps="1000" \
 	--save_strategy="steps" \
-	--save_steps="1000" \
 	--generation_max_length="225" \
 	--length_column_name="input_length" \
 	--max_duration_in_seconds="30" \

 	--train_split_name="train+validation" \
 	--eval_split_name="test" \
 	--model_index_name="Whisper Small Basque" \
+	--max_steps="8000" \
 	--output_dir="./" \
 	--per_device_train_batch_size="4" \
 	--per_device_eval_batch_size="8" \
 	--gradient_accumulation_steps="1" \
 	--logging_steps="25" \
+	--learning_rate="6e-6" \
 	--warmup_steps="500" \
 	--evaluation_strategy="steps" \
 	--eval_steps="1000" \
 	--save_strategy="steps" \
+	--save_steps="500" \
 	--generation_max_length="225" \
 	--length_column_name="input_length" \
 	--max_duration_in_seconds="30" \