|
{ |
|
"best_metric": 0.8324507208002354, |
|
"best_model_checkpoint": "wav2vec2-base-ks-linear_lrX1000/checkpoint-350", |
|
"epoch": 10.0, |
|
"global_step": 500, |
|
"is_hyper_param_search": false, |
|
"is_local_process_zero": true, |
|
"is_world_process_zero": true, |
|
"log_history": [ |
|
{ |
|
"epoch": 0.2, |
|
"learning_rate": 0.006, |
|
"loss": 2.078, |
|
"step": 10 |
|
}, |
|
{ |
|
"epoch": 0.4, |
|
"learning_rate": 0.012, |
|
"loss": 1.9515, |
|
"step": 20 |
|
}, |
|
{ |
|
"epoch": 0.6, |
|
"learning_rate": 0.018, |
|
"loss": 1.625, |
|
"step": 30 |
|
}, |
|
{ |
|
"epoch": 0.8, |
|
"learning_rate": 0.024, |
|
"loss": 0.9844, |
|
"step": 40 |
|
}, |
|
{ |
|
"epoch": 1.0, |
|
"learning_rate": 0.03, |
|
"loss": 0.7558, |
|
"step": 50 |
|
}, |
|
{ |
|
"epoch": 1.0, |
|
"eval_accuracy": 0.6462194763165637, |
|
"eval_loss": 1.0584145784378052, |
|
"eval_runtime": 21.5879, |
|
"eval_samples_per_second": 314.899, |
|
"eval_steps_per_second": 1.251, |
|
"step": 50 |
|
}, |
|
{ |
|
"epoch": 1.2, |
|
"learning_rate": 0.029333333333333333, |
|
"loss": 0.7432, |
|
"step": 60 |
|
}, |
|
{ |
|
"epoch": 1.4, |
|
"learning_rate": 0.028666666666666667, |
|
"loss": 0.6872, |
|
"step": 70 |
|
}, |
|
{ |
|
"epoch": 1.6, |
|
"learning_rate": 0.028, |
|
"loss": 0.6169, |
|
"step": 80 |
|
}, |
|
{ |
|
"epoch": 1.8, |
|
"learning_rate": 0.02733333333333333, |
|
"loss": 0.6001, |
|
"step": 90 |
|
}, |
|
{ |
|
"epoch": 2.0, |
|
"learning_rate": 0.026666666666666665, |
|
"loss": 0.5971, |
|
"step": 100 |
|
}, |
|
{ |
|
"epoch": 2.0, |
|
"eval_accuracy": 0.7509561635775228, |
|
"eval_loss": 0.7815613150596619, |
|
"eval_runtime": 21.5518, |
|
"eval_samples_per_second": 315.427, |
|
"eval_steps_per_second": 1.253, |
|
"step": 100 |
|
}, |
|
{ |
|
"epoch": 2.2, |
|
"learning_rate": 0.026, |
|
"loss": 0.5564, |
|
"step": 110 |
|
}, |
|
{ |
|
"epoch": 2.4, |
|
"learning_rate": 0.025333333333333333, |
|
"loss": 0.5688, |
|
"step": 120 |
|
}, |
|
{ |
|
"epoch": 2.6, |
|
"learning_rate": 0.024666666666666663, |
|
"loss": 0.547, |
|
"step": 130 |
|
}, |
|
{ |
|
"epoch": 2.8, |
|
"learning_rate": 0.024, |
|
"loss": 0.554, |
|
"step": 140 |
|
}, |
|
{ |
|
"epoch": 3.0, |
|
"learning_rate": 0.023333333333333334, |
|
"loss": 0.5382, |
|
"step": 150 |
|
}, |
|
{ |
|
"epoch": 3.0, |
|
"eval_accuracy": 0.7519858781994704, |
|
"eval_loss": 0.7870466113090515, |
|
"eval_runtime": 21.5731, |
|
"eval_samples_per_second": 315.114, |
|
"eval_steps_per_second": 1.252, |
|
"step": 150 |
|
}, |
|
{ |
|
"epoch": 3.2, |
|
"learning_rate": 0.022666666666666665, |
|
"loss": 0.5201, |
|
"step": 160 |
|
}, |
|
{ |
|
"epoch": 3.4, |
|
"learning_rate": 0.022, |
|
"loss": 0.5182, |
|
"step": 170 |
|
}, |
|
{ |
|
"epoch": 3.6, |
|
"learning_rate": 0.021333333333333333, |
|
"loss": 0.4925, |
|
"step": 180 |
|
}, |
|
{ |
|
"epoch": 3.8, |
|
"learning_rate": 0.020666666666666667, |
|
"loss": 0.4796, |
|
"step": 190 |
|
}, |
|
{ |
|
"epoch": 4.0, |
|
"learning_rate": 0.019999999999999997, |
|
"loss": 0.5045, |
|
"step": 200 |
|
}, |
|
{ |
|
"epoch": 4.0, |
|
"eval_accuracy": 0.7880258899676376, |
|
"eval_loss": 0.6646667718887329, |
|
"eval_runtime": 21.561, |
|
"eval_samples_per_second": 315.291, |
|
"eval_steps_per_second": 1.252, |
|
"step": 200 |
|
}, |
|
{ |
|
"epoch": 4.2, |
|
"learning_rate": 0.019333333333333334, |
|
"loss": 0.4937, |
|
"step": 210 |
|
}, |
|
{ |
|
"epoch": 4.4, |
|
"learning_rate": 0.018666666666666665, |
|
"loss": 0.5115, |
|
"step": 220 |
|
}, |
|
{ |
|
"epoch": 4.6, |
|
"learning_rate": 0.018, |
|
"loss": 0.5066, |
|
"step": 230 |
|
}, |
|
{ |
|
"epoch": 4.8, |
|
"learning_rate": 0.017333333333333333, |
|
"loss": 0.5229, |
|
"step": 240 |
|
}, |
|
{ |
|
"epoch": 5.0, |
|
"learning_rate": 0.016666666666666666, |
|
"loss": 0.4717, |
|
"step": 250 |
|
}, |
|
{ |
|
"epoch": 5.0, |
|
"eval_accuracy": 0.6053250956163577, |
|
"eval_loss": 1.157195806503296, |
|
"eval_runtime": 21.5727, |
|
"eval_samples_per_second": 315.121, |
|
"eval_steps_per_second": 1.252, |
|
"step": 250 |
|
}, |
|
{ |
|
"epoch": 5.2, |
|
"learning_rate": 0.016, |
|
"loss": 0.4958, |
|
"step": 260 |
|
}, |
|
{ |
|
"epoch": 5.4, |
|
"learning_rate": 0.01533333333333333, |
|
"loss": 0.4583, |
|
"step": 270 |
|
}, |
|
{ |
|
"epoch": 5.6, |
|
"learning_rate": 0.014666666666666666, |
|
"loss": 0.4818, |
|
"step": 280 |
|
}, |
|
{ |
|
"epoch": 5.8, |
|
"learning_rate": 0.014, |
|
"loss": 0.453, |
|
"step": 290 |
|
}, |
|
{ |
|
"epoch": 6.0, |
|
"learning_rate": 0.013333333333333332, |
|
"loss": 0.4651, |
|
"step": 300 |
|
}, |
|
{ |
|
"epoch": 6.0, |
|
"eval_accuracy": 0.7944983818770227, |
|
"eval_loss": 0.6386590600013733, |
|
"eval_runtime": 21.5083, |
|
"eval_samples_per_second": 316.064, |
|
"eval_steps_per_second": 1.255, |
|
"step": 300 |
|
}, |
|
{ |
|
"epoch": 6.2, |
|
"learning_rate": 0.012666666666666666, |
|
"loss": 0.4753, |
|
"step": 310 |
|
}, |
|
{ |
|
"epoch": 6.4, |
|
"learning_rate": 0.012, |
|
"loss": 0.4375, |
|
"step": 320 |
|
}, |
|
{ |
|
"epoch": 6.6, |
|
"learning_rate": 0.011333333333333332, |
|
"loss": 0.4621, |
|
"step": 330 |
|
}, |
|
{ |
|
"epoch": 6.8, |
|
"learning_rate": 0.010666666666666666, |
|
"loss": 0.4491, |
|
"step": 340 |
|
}, |
|
{ |
|
"epoch": 7.0, |
|
"learning_rate": 0.009999999999999998, |
|
"loss": 0.4205, |
|
"step": 350 |
|
}, |
|
{ |
|
"epoch": 7.0, |
|
"eval_accuracy": 0.8324507208002354, |
|
"eval_loss": 0.5661188960075378, |
|
"eval_runtime": 21.6613, |
|
"eval_samples_per_second": 313.831, |
|
"eval_steps_per_second": 1.246, |
|
"step": 350 |
|
}, |
|
{ |
|
"epoch": 7.2, |
|
"learning_rate": 0.009333333333333332, |
|
"loss": 0.4489, |
|
"step": 360 |
|
}, |
|
{ |
|
"epoch": 7.4, |
|
"learning_rate": 0.008666666666666666, |
|
"loss": 0.4413, |
|
"step": 370 |
|
}, |
|
{ |
|
"epoch": 7.6, |
|
"learning_rate": 0.008, |
|
"loss": 0.4273, |
|
"step": 380 |
|
}, |
|
{ |
|
"epoch": 7.8, |
|
"learning_rate": 0.007333333333333333, |
|
"loss": 0.4379, |
|
"step": 390 |
|
}, |
|
{ |
|
"epoch": 8.0, |
|
"learning_rate": 0.006666666666666666, |
|
"loss": 0.4423, |
|
"step": 400 |
|
}, |
|
{ |
|
"epoch": 8.0, |
|
"eval_accuracy": 0.7846425419240953, |
|
"eval_loss": 0.710049569606781, |
|
"eval_runtime": 21.7419, |
|
"eval_samples_per_second": 312.669, |
|
"eval_steps_per_second": 1.242, |
|
"step": 400 |
|
}, |
|
{ |
|
"epoch": 8.2, |
|
"learning_rate": 0.006, |
|
"loss": 0.414, |
|
"step": 410 |
|
}, |
|
{ |
|
"epoch": 8.4, |
|
"learning_rate": 0.005333333333333333, |
|
"loss": 0.4385, |
|
"step": 420 |
|
}, |
|
{ |
|
"epoch": 8.6, |
|
"learning_rate": 0.004666666666666666, |
|
"loss": 0.4319, |
|
"step": 430 |
|
}, |
|
{ |
|
"epoch": 8.8, |
|
"learning_rate": 0.004, |
|
"loss": 0.407, |
|
"step": 440 |
|
}, |
|
{ |
|
"epoch": 9.0, |
|
"learning_rate": 0.003333333333333333, |
|
"loss": 0.426, |
|
"step": 450 |
|
}, |
|
{ |
|
"epoch": 9.0, |
|
"eval_accuracy": 0.7828773168578994, |
|
"eval_loss": 0.7053545117378235, |
|
"eval_runtime": 21.6406, |
|
"eval_samples_per_second": 314.131, |
|
"eval_steps_per_second": 1.248, |
|
"step": 450 |
|
}, |
|
{ |
|
"epoch": 9.2, |
|
"learning_rate": 0.0026666666666666666, |
|
"loss": 0.4198, |
|
"step": 460 |
|
}, |
|
{ |
|
"epoch": 9.4, |
|
"learning_rate": 0.002, |
|
"loss": 0.4325, |
|
"step": 470 |
|
}, |
|
{ |
|
"epoch": 9.6, |
|
"learning_rate": 0.0013333333333333333, |
|
"loss": 0.3989, |
|
"step": 480 |
|
}, |
|
{ |
|
"epoch": 9.8, |
|
"learning_rate": 0.0006666666666666666, |
|
"loss": 0.4232, |
|
"step": 490 |
|
}, |
|
{ |
|
"epoch": 10.0, |
|
"learning_rate": 0.0, |
|
"loss": 0.4067, |
|
"step": 500 |
|
}, |
|
{ |
|
"epoch": 10.0, |
|
"eval_accuracy": 0.8114151220947338, |
|
"eval_loss": 0.6287888884544373, |
|
"eval_runtime": 21.6259, |
|
"eval_samples_per_second": 314.346, |
|
"eval_steps_per_second": 1.249, |
|
"step": 500 |
|
}, |
|
{ |
|
"epoch": 10.0, |
|
"step": 500, |
|
"total_flos": 4.6387626201984e+18, |
|
"train_loss": 0.5883967700004578, |
|
"train_runtime": 2872.1803, |
|
"train_samples_per_second": 177.893, |
|
"train_steps_per_second": 0.174 |
|
} |
|
], |
|
"max_steps": 500, |
|
"num_train_epochs": 10, |
|
"total_flos": 4.6387626201984e+18, |
|
"trial_name": null, |
|
"trial_params": null |
|
} |
|
|