wav2vec2-xls-r-1b-hy / trainer_state.json

iter 3

d6eb9bc about 3 years ago

6.93 kB

	{
	"best_metric": 0.18266724050045013,
	"best_model_checkpoint": "./checkpoint-3200",
	"epoch": 56.14035087719298,
	"global_step": 3200,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 3.51,
	"learning_rate": 4.980500000000001e-05,
	"loss": 4.0311,
	"step": 200
	},
	{
	"epoch": 3.51,
	"eval_cer": 0.23737986848760748,
	"eval_loss": 0.794314444065094,
	"eval_runtime": 15.7,
	"eval_samples_per_second": 21.338,
	"eval_steps_per_second": 0.382,
	"eval_wer": 0.8981264637002342,
	"step": 200
	},
	{
	"epoch": 7.02,
	"learning_rate": 8e-05,
	"loss": 1.4388,
	"step": 400
	},
	{
	"epoch": 7.02,
	"eval_cer": 0.06575619625695499,
	"eval_loss": 0.2545942962169647,
	"eval_runtime": 14.891,
	"eval_samples_per_second": 22.497,
	"eval_steps_per_second": 0.403,
	"eval_wer": 0.38212334113973456,
	"step": 400
	},
	{
	"epoch": 10.53,
	"learning_rate": 8e-05,
	"loss": 1.0949,
	"step": 600
	},
	{
	"epoch": 10.53,
	"eval_cer": 0.057309054122407686,
	"eval_loss": 0.22006691992282867,
	"eval_runtime": 15.2331,
	"eval_samples_per_second": 21.992,
	"eval_steps_per_second": 0.394,
	"eval_wer": 0.32162373145979706,
	"step": 600
	},
	{
	"epoch": 14.04,
	"learning_rate": 8e-05,
	"loss": 1.0279,
	"step": 800
	},
	{
	"epoch": 14.04,
	"eval_cer": 0.0582701062215478,
	"eval_loss": 0.22504645586013794,
	"eval_runtime": 15.1767,
	"eval_samples_per_second": 22.073,
	"eval_steps_per_second": 0.395,
	"eval_wer": 0.32708821233411395,
	"step": 800
	},
	{
	"epoch": 17.54,
	"learning_rate": 8e-05,
	"loss": 0.9923,
	"step": 1000
	},
	{
	"epoch": 17.54,
	"eval_cer": 0.0543247344461305,
	"eval_loss": 0.2073642760515213,
	"eval_runtime": 15.1305,
	"eval_samples_per_second": 22.141,
	"eval_steps_per_second": 0.397,
	"eval_wer": 0.3110850897736144,
	"step": 1000
	},
	{
	"epoch": 21.05,
	"learning_rate": 8e-05,
	"loss": 0.972,
	"step": 1200
	},
	{
	"epoch": 21.05,
	"eval_cer": 0.05361659079413252,
	"eval_loss": 0.21649114787578583,
	"eval_runtime": 14.9827,
	"eval_samples_per_second": 22.359,
	"eval_steps_per_second": 0.4,
	"eval_wer": 0.29547228727556596,
	"step": 1200
	},
	{
	"epoch": 24.56,
	"learning_rate": 8e-05,
	"loss": 0.9587,
	"step": 1400
	},
	{
	"epoch": 24.56,
	"eval_cer": 0.05351542741527567,
	"eval_loss": 0.2064175009727478,
	"eval_runtime": 15.1921,
	"eval_samples_per_second": 22.051,
	"eval_steps_per_second": 0.395,
	"eval_wer": 0.3017174082747853,
	"step": 1400
	},
	{
	"epoch": 28.07,
	"learning_rate": 8e-05,
	"loss": 0.9421,
	"step": 1600
	},
	{
	"epoch": 28.07,
	"eval_cer": 0.051947395042994435,
	"eval_loss": 0.2061864584684372,
	"eval_runtime": 15.0418,
	"eval_samples_per_second": 22.271,
	"eval_steps_per_second": 0.399,
	"eval_wer": 0.28844652615144417,
	"step": 1600
	},
	{
	"epoch": 31.58,
	"learning_rate": 7.059500000000001e-05,
	"loss": 0.9189,
	"step": 1800
	},
	{
	"epoch": 31.58,
	"eval_cer": 0.05073343449671219,
	"eval_loss": 0.2014162391424179,
	"eval_runtime": 15.125,
	"eval_samples_per_second": 22.149,
	"eval_steps_per_second": 0.397,
	"eval_wer": 0.2822014051522248,
	"step": 1800
	},
	{
	"epoch": 35.09,
	"learning_rate": 6.109500000000001e-05,
	"loss": 0.8919,
	"step": 2000
	},
	{
	"epoch": 35.09,
	"eval_cer": 0.04881133029843197,
	"eval_loss": 0.19518214464187622,
	"eval_runtime": 15.0854,
	"eval_samples_per_second": 22.207,
	"eval_steps_per_second": 0.398,
	"eval_wer": 0.2689305230288837,
	"step": 2000
	},
	{
	"epoch": 38.6,
	"learning_rate": 5.1594999999999996e-05,
	"loss": 0.8615,
	"step": 2200
	},
	{
	"epoch": 38.6,
	"eval_cer": 0.04795144157814871,
	"eval_loss": 0.20196911692619324,
	"eval_runtime": 15.1604,
	"eval_samples_per_second": 22.097,
	"eval_steps_per_second": 0.396,
	"eval_wer": 0.2685402029664325,
	"step": 2200
	},
	{
	"epoch": 42.11,
	"learning_rate": 4.2095e-05,
	"loss": 0.834,
	"step": 2400
	},
	{
	"epoch": 42.11,
	"eval_cer": 0.04668689934243804,
	"eval_loss": 0.2001034915447235,
	"eval_runtime": 15.091,
	"eval_samples_per_second": 22.199,
	"eval_steps_per_second": 0.398,
	"eval_wer": 0.2654176424668228,
	"step": 2400
	},
	{
	"epoch": 45.61,
	"learning_rate": 3.2595e-05,
	"loss": 0.8056,
	"step": 2600
	},
	{
	"epoch": 45.61,
	"eval_cer": 0.04481537683358624,
	"eval_loss": 0.1934908777475357,
	"eval_runtime": 15.4173,
	"eval_samples_per_second": 21.729,
	"eval_steps_per_second": 0.389,
	"eval_wer": 0.2498048399687744,
	"step": 2600
	},
	{
	"epoch": 49.12,
	"learning_rate": 2.3095e-05,
	"loss": 0.7888,
	"step": 2800
	},
	{
	"epoch": 49.12,
	"eval_cer": 0.04461305007587253,
	"eval_loss": 0.18915079534053802,
	"eval_runtime": 15.29,
	"eval_samples_per_second": 21.91,
	"eval_steps_per_second": 0.392,
	"eval_wer": 0.24512099921935987,
	"step": 2800
	},
	{
	"epoch": 52.63,
	"learning_rate": 1.3595000000000008e-05,
	"loss": 0.761,
	"step": 3000
	},
	{
	"epoch": 52.63,
	"eval_cer": 0.044056651492159836,
	"eval_loss": 0.18836112320423126,
	"eval_runtime": 16.204,
	"eval_samples_per_second": 20.674,
	"eval_steps_per_second": 0.37,
	"eval_wer": 0.24316939890710382,
	"step": 3000
	},
	{
	"epoch": 56.14,
	"learning_rate": 4.095000000000005e-06,
	"loss": 0.742,
	"step": 3200
	},
	{
	"epoch": 56.14,
	"eval_cer": 0.04274152756702074,
	"eval_loss": 0.18266724050045013,
	"eval_runtime": 15.3463,
	"eval_samples_per_second": 21.829,
	"eval_steps_per_second": 0.391,
	"eval_wer": 0.2388758782201405,
	"step": 3200
	},
	{
	"epoch": 56.14,
	"step": 3200,
	"total_flos": 2.6268075931237872e+20,
	"train_loss": 1.1288447761535645,
	"train_runtime": 34425.8492,
	"train_samples_per_second": 11.898,
	"train_steps_per_second": 0.093
	}
	],
	"max_steps": 3200,
	"num_train_epochs": 57,
	"total_flos": 2.6268075931237872e+20,
	"trial_name": null,
	"trial_params": null
	}