clrcmd / 20211030_214310 /checkpoint-6250 /trainer_state.json

Seonghyeon Lee

feat: upload checkpoints

d0d9004 about 1 year ago

4.39 kB

	{
	"best_metric": 0.8743490288894621,
	"best_model_checkpoint": "/home/sh0416/checkpoints/20211030_214310/checkpoint-2000",
	"epoch": 2.9029261495587555,
	"global_step": 6250,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.12,
	"eval_stsb_spearman": 0.8619587943822085,
	"step": 250
	},
	{
	"epoch": 0.23,
	"learning_rate": 5.536460752438458e-05,
	"loss": 0.6154,
	"step": 500
	},
	{
	"epoch": 0.23,
	"eval_stsb_spearman": 0.8664063579418333,
	"step": 500
	},
	{
	"epoch": 0.35,
	"eval_stsb_spearman": 0.8678607699749815,
	"step": 750
	},
	{
	"epoch": 0.46,
	"learning_rate": 5.071992568509057e-05,
	"loss": 0.456,
	"step": 1000
	},
	{
	"epoch": 0.46,
	"eval_stsb_spearman": 0.8696681324290129,
	"step": 1000
	},
	{
	"epoch": 0.58,
	"eval_stsb_spearman": 0.8694780529998698,
	"step": 1250
	},
	{
	"epoch": 0.7,
	"learning_rate": 4.6075243845796564e-05,
	"loss": 0.4169,
	"step": 1500
	},
	{
	"epoch": 0.7,
	"eval_stsb_spearman": 0.8743462420732259,
	"step": 1500
	},
	{
	"epoch": 0.81,
	"eval_stsb_spearman": 0.8730453411593506,
	"step": 1750
	},
	{
	"epoch": 0.93,
	"learning_rate": 4.1430562006502555e-05,
	"loss": 0.3886,
	"step": 2000
	},
	{
	"epoch": 0.93,
	"eval_stsb_spearman": 0.8743490288894621,
	"step": 2000
	},
	{
	"epoch": 1.05,
	"eval_stsb_spearman": 0.867487872921151,
	"step": 2250
	},
	{
	"epoch": 1.16,
	"learning_rate": 3.678588016720855e-05,
	"loss": 0.3271,
	"step": 2500
	},
	{
	"epoch": 1.16,
	"eval_stsb_spearman": 0.8690060216529756,
	"step": 2500
	},
	{
	"epoch": 1.28,
	"eval_stsb_spearman": 0.8691859025597116,
	"step": 2750
	},
	{
	"epoch": 1.39,
	"learning_rate": 3.215977705527172e-05,
	"loss": 0.2888,
	"step": 3000
	},
	{
	"epoch": 1.39,
	"eval_stsb_spearman": 0.8664495448043005,
	"step": 3000
	},
	{
	"epoch": 1.51,
	"eval_stsb_spearman": 0.8702266798503593,
	"step": 3250
	},
	{
	"epoch": 1.63,
	"learning_rate": 2.7515095215977708e-05,
	"loss": 0.2891,
	"step": 3500
	},
	{
	"epoch": 1.63,
	"eval_stsb_spearman": 0.8697157036361349,
	"step": 3500
	},
	{
	"epoch": 1.74,
	"eval_stsb_spearman": 0.8718566471659391,
	"step": 3750
	},
	{
	"epoch": 1.86,
	"learning_rate": 2.2870413376683696e-05,
	"loss": 0.2786,
	"step": 4000
	},
	{
	"epoch": 1.86,
	"eval_stsb_spearman": 0.8734045602678231,
	"step": 4000
	},
	{
	"epoch": 1.97,
	"eval_stsb_spearman": 0.8666361853828297,
	"step": 4250
	},
	{
	"epoch": 2.09,
	"learning_rate": 1.8225731537389688e-05,
	"loss": 0.2425,
	"step": 4500
	},
	{
	"epoch": 2.09,
	"eval_stsb_spearman": 0.8684804714691581,
	"step": 4500
	},
	{
	"epoch": 2.21,
	"eval_stsb_spearman": 0.8730523340467264,
	"step": 4750
	},
	{
	"epoch": 2.32,
	"learning_rate": 1.358104969809568e-05,
	"loss": 0.2067,
	"step": 5000
	},
	{
	"epoch": 2.32,
	"eval_stsb_spearman": 0.8657396119312887,
	"step": 5000
	},
	{
	"epoch": 2.44,
	"eval_stsb_spearman": 0.8671806965531279,
	"step": 5250
	},
	{
	"epoch": 2.55,
	"learning_rate": 8.936367858801672e-06,
	"loss": 0.2081,
	"step": 5500
	},
	{
	"epoch": 2.55,
	"eval_stsb_spearman": 0.8697212214335274,
	"step": 5500
	},
	{
	"epoch": 2.67,
	"eval_stsb_spearman": 0.8702478720357839,
	"step": 5750
	},
	{
	"epoch": 2.79,
	"learning_rate": 4.291686019507663e-06,
	"loss": 0.203,
	"step": 6000
	},
	{
	"epoch": 2.79,
	"eval_stsb_spearman": 0.8678194806823684,
	"step": 6000
	},
	{
	"epoch": 2.9,
	"eval_stsb_spearman": 0.8679564426387009,
	"step": 6250
	}
	],
	"max_steps": 6459,
	"num_train_epochs": 3,
	"total_flos": 0.0,
	"trial_name": null,
	"trial_params": null
	}