Md Mushfiqur Rahman

Upload with huggingface_hub

a15dae3 over 1 year ago

6.04 kB

	{
	"best_metric": 14.889152449594015,
	"best_model_checkpoint": "/scratch/mrahma45/pixel/finetuned_models/bert/bert-base-finetuned-parsing-ud-Coptic-Scriptorium/checkpoint-500",
	"epoch": 76.92307692307692,
	"global_step": 3000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 2.56,
	"learning_rate": 7.6e-05,
	"loss": 5.3836,
	"step": 100
	},
	{
	"epoch": 5.13,
	"learning_rate": 7.948993288590604e-05,
	"loss": 4.1364,
	"step": 200
	},
	{
	"epoch": 7.69,
	"learning_rate": 7.895302013422819e-05,
	"loss": 3.8943,
	"step": 300
	},
	{
	"epoch": 10.26,
	"learning_rate": 7.841610738255034e-05,
	"loss": 3.7384,
	"step": 400
	},
	{
	"epoch": 12.82,
	"learning_rate": 7.787919463087249e-05,
	"loss": 3.5767,
	"step": 500
	},
	{
	"epoch": 12.82,
	"eval_las": 14.889152449594015,
	"eval_loss": 4.103353500366211,
	"eval_runtime": 2.9493,
	"eval_samples_per_second": 129.182,
	"eval_steps_per_second": 16.275,
	"eval_uas": 31.748928017516647,
	"step": 500
	},
	{
	"epoch": 15.38,
	"learning_rate": 7.734228187919463e-05,
	"loss": 3.4084,
	"step": 600
	},
	{
	"epoch": 17.95,
	"learning_rate": 7.680536912751678e-05,
	"loss": 3.2001,
	"step": 700
	},
	{
	"epoch": 20.51,
	"learning_rate": 7.626845637583893e-05,
	"loss": 2.9538,
	"step": 800
	},
	{
	"epoch": 23.08,
	"learning_rate": 7.573154362416108e-05,
	"loss": 2.7223,
	"step": 900
	},
	{
	"epoch": 25.64,
	"learning_rate": 7.519463087248323e-05,
	"loss": 2.4472,
	"step": 1000
	},
	{
	"epoch": 25.64,
	"eval_las": 11.248973633792538,
	"eval_loss": 5.691993713378906,
	"eval_runtime": 2.9489,
	"eval_samples_per_second": 129.203,
	"eval_steps_per_second": 16.278,
	"eval_uas": 27.926284098166228,
	"step": 1000
	},
	{
	"epoch": 28.21,
	"learning_rate": 7.465771812080537e-05,
	"loss": 2.2519,
	"step": 1100
	},
	{
	"epoch": 30.77,
	"learning_rate": 7.412080536912752e-05,
	"loss": 2.0317,
	"step": 1200
	},
	{
	"epoch": 33.33,
	"learning_rate": 7.358389261744967e-05,
	"loss": 1.8544,
	"step": 1300
	},
	{
	"epoch": 35.9,
	"learning_rate": 7.304697986577182e-05,
	"loss": 1.7134,
	"step": 1400
	},
	{
	"epoch": 38.46,
	"learning_rate": 7.251006711409397e-05,
	"loss": 1.5671,
	"step": 1500
	},
	{
	"epoch": 38.46,
	"eval_las": 9.871362101997994,
	"eval_loss": 7.934547424316406,
	"eval_runtime": 2.9464,
	"eval_samples_per_second": 129.311,
	"eval_steps_per_second": 16.291,
	"eval_uas": 25.444758689900553,
	"step": 1500
	},
	{
	"epoch": 41.03,
	"learning_rate": 7.197315436241612e-05,
	"loss": 1.4647,
	"step": 1600
	},
	{
	"epoch": 43.59,
	"learning_rate": 7.143624161073826e-05,
	"loss": 1.3584,
	"step": 1700
	},
	{
	"epoch": 46.15,
	"learning_rate": 7.089932885906041e-05,
	"loss": 1.2918,
	"step": 1800
	},
	{
	"epoch": 48.72,
	"learning_rate": 7.036241610738256e-05,
	"loss": 1.2333,
	"step": 1900
	},
	{
	"epoch": 51.28,
	"learning_rate": 6.982550335570471e-05,
	"loss": 1.2108,
	"step": 2000
	},
	{
	"epoch": 51.28,
	"eval_las": 9.570294681142231,
	"eval_loss": 10.208051681518555,
	"eval_runtime": 2.9507,
	"eval_samples_per_second": 129.123,
	"eval_steps_per_second": 16.267,
	"eval_uas": 24.58717270322051,
	"step": 2000
	},
	{
	"epoch": 53.85,
	"learning_rate": 6.928859060402686e-05,
	"loss": 1.1363,
	"step": 2100
	},
	{
	"epoch": 56.41,
	"learning_rate": 6.8751677852349e-05,
	"loss": 1.1452,
	"step": 2200
	},
	{
	"epoch": 58.97,
	"learning_rate": 6.821476510067115e-05,
	"loss": 1.0937,
	"step": 2300
	},
	{
	"epoch": 61.54,
	"learning_rate": 6.76778523489933e-05,
	"loss": 1.0555,
	"step": 2400
	},
	{
	"epoch": 64.1,
	"learning_rate": 6.714093959731544e-05,
	"loss": 1.0311,
	"step": 2500
	},
	{
	"epoch": 64.1,
	"eval_las": 9.707143508803942,
	"eval_loss": 11.06482219696045,
	"eval_runtime": 2.9481,
	"eval_samples_per_second": 129.236,
	"eval_steps_per_second": 16.282,
	"eval_uas": 24.368214578961776,
	"step": 2500
	},
	{
	"epoch": 66.67,
	"learning_rate": 6.660402684563758e-05,
	"loss": 1.0068,
	"step": 2600
	},
	{
	"epoch": 69.23,
	"learning_rate": 6.606711409395973e-05,
	"loss": 1.0095,
	"step": 2700
	},
	{
	"epoch": 71.79,
	"learning_rate": 6.553020134228188e-05,
	"loss": 0.9792,
	"step": 2800
	},
	{
	"epoch": 74.36,
	"learning_rate": 6.499328859060403e-05,
	"loss": 0.988,
	"step": 2900
	},
	{
	"epoch": 76.92,
	"learning_rate": 6.445637583892618e-05,
	"loss": 0.9661,
	"step": 3000
	},
	{
	"epoch": 76.92,
	"eval_las": 9.670650488094152,
	"eval_loss": 10.523516654968262,
	"eval_runtime": 2.9465,
	"eval_samples_per_second": 129.304,
	"eval_steps_per_second": 16.29,
	"eval_uas": 24.41383085484901,
	"step": 3000
	},
	{
	"epoch": 76.92,
	"step": 3000,
	"total_flos": 1.5763284763250688e+16,
	"train_loss": 2.0616751454671225,
	"train_runtime": 1642.7036,
	"train_samples_per_second": 292.201,
	"train_steps_per_second": 9.131
	}
	],
	"max_steps": 15000,
	"num_train_epochs": 385,
	"total_flos": 1.5763284763250688e+16,
	"trial_name": null,
	"trial_params": null
	}