🍻 cheers

0722a99 6 months ago

No virus

54 kB

	{
	"best_metric": 0.08124219626188278,
	"best_model_checkpoint": "/home1/datawork/mcontini/models/multilabel/huggingface/dinov2-large-2024_01_05-kornia_img-size518_batch-size32_epochs70_freeze/checkpoint-28496",
	"epoch": 114.0,
	"eval_steps": 500,
	"global_step": 31236,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 1.0,
	"eval_accuracy": 0.44556873691556176,
	"eval_f1_macro": 0.5755948244574681,
	"eval_f1_micro": 0.7376394107473012,
	"eval_loss": 0.13577787578105927,
	"eval_roc_auc": 0.8276012534175776,
	"eval_runtime": 686.0469,
	"eval_samples_per_second": 4.178,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.01,
	"step": 274
	},
	{
	"epoch": 1.82,
	"learning_rate": 0.01,
	"loss": 0.1895,
	"step": 500
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.4357990230286113,
	"eval_f1_macro": 0.6131029690652663,
	"eval_f1_micro": 0.7463369963369964,
	"eval_loss": 0.14224015176296234,
	"eval_roc_auc": 0.8432701847378548,
	"eval_runtime": 679.513,
	"eval_samples_per_second": 4.218,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.01,
	"step": 548
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.38415910676901605,
	"eval_f1_macro": 0.5242425898328716,
	"eval_f1_micro": 0.7273147345925026,
	"eval_loss": 0.21337130665779114,
	"eval_roc_auc": 0.8305454415797603,
	"eval_runtime": 681.6164,
	"eval_samples_per_second": 4.205,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.01,
	"step": 822
	},
	{
	"epoch": 3.65,
	"learning_rate": 0.01,
	"loss": 0.1668,
	"step": 1000
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.4438241451500349,
	"eval_f1_macro": 0.5474301561230492,
	"eval_f1_micro": 0.7034210860994532,
	"eval_loss": 0.14501234889030457,
	"eval_roc_auc": 0.7947377699358407,
	"eval_runtime": 676.7895,
	"eval_samples_per_second": 4.235,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.01,
	"step": 1096
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.4438241451500349,
	"eval_f1_macro": 0.6194844495540315,
	"eval_f1_micro": 0.7611423380457615,
	"eval_loss": 0.13293854892253876,
	"eval_roc_auc": 0.8535844928345971,
	"eval_runtime": 676.1205,
	"eval_samples_per_second": 4.239,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.01,
	"step": 1370
	},
	{
	"epoch": 5.47,
	"learning_rate": 0.01,
	"loss": 0.1666,
	"step": 1500
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.44452198185624564,
	"eval_f1_macro": 0.5624987041776927,
	"eval_f1_micro": 0.752847713067352,
	"eval_loss": 0.13243332505226135,
	"eval_roc_auc": 0.8411441150969292,
	"eval_runtime": 676.3907,
	"eval_samples_per_second": 4.237,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.01,
	"step": 1644
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.43126308443824146,
	"eval_f1_macro": 0.5689553622505643,
	"eval_f1_micro": 0.7496488764044945,
	"eval_loss": 0.13447266817092896,
	"eval_roc_auc": 0.838952950800037,
	"eval_runtime": 675.7851,
	"eval_samples_per_second": 4.241,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.01,
	"step": 1918
	},
	{
	"epoch": 7.3,
	"learning_rate": 0.01,
	"loss": 0.1664,
	"step": 2000
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.4323098394975576,
	"eval_f1_macro": 0.5627920395195278,
	"eval_f1_micro": 0.7502482911725186,
	"eval_loss": 0.13808754086494446,
	"eval_roc_auc": 0.8397325865953646,
	"eval_runtime": 681.8119,
	"eval_samples_per_second": 4.204,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.01,
	"step": 2192
	},
	{
	"epoch": 9.0,
	"eval_accuracy": 0.44033496161898117,
	"eval_f1_macro": 0.5492251158735639,
	"eval_f1_micro": 0.7395667604944316,
	"eval_loss": 0.13694943487644196,
	"eval_roc_auc": 0.8219722316265465,
	"eval_runtime": 674.9771,
	"eval_samples_per_second": 4.246,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.01,
	"step": 2466
	},
	{
	"epoch": 9.12,
	"learning_rate": 0.01,
	"loss": 0.1656,
	"step": 2500
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.4424284717376134,
	"eval_f1_macro": 0.528180519175626,
	"eval_f1_micro": 0.7326552851434799,
	"eval_loss": 0.13609227538108826,
	"eval_roc_auc": 0.821178691278072,
	"eval_runtime": 674.2621,
	"eval_samples_per_second": 4.251,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.01,
	"step": 2740
	},
	{
	"epoch": 10.95,
	"learning_rate": 0.01,
	"loss": 0.166,
	"step": 3000
	},
	{
	"epoch": 11.0,
	"eval_accuracy": 0.4277739009071877,
	"eval_f1_macro": 0.5428317486981787,
	"eval_f1_micro": 0.7434225844004656,
	"eval_loss": 0.1380929797887802,
	"eval_roc_auc": 0.8371006883503846,
	"eval_runtime": 676.158,
	"eval_samples_per_second": 4.239,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.01,
	"step": 3014
	},
	{
	"epoch": 12.0,
	"eval_accuracy": 0.444870900209351,
	"eval_f1_macro": 0.5618568055480317,
	"eval_f1_micro": 0.7354685646500594,
	"eval_loss": 0.1344844251871109,
	"eval_roc_auc": 0.827911942291835,
	"eval_runtime": 683.7162,
	"eval_samples_per_second": 4.192,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.01,
	"step": 3288
	},
	{
	"epoch": 12.77,
	"learning_rate": 0.001,
	"loss": 0.1585,
	"step": 3500
	},
	{
	"epoch": 13.0,
	"eval_accuracy": 0.49023028611304953,
	"eval_f1_macro": 0.650060261894195,
	"eval_f1_micro": 0.8009333029820168,
	"eval_loss": 0.11546628922224045,
	"eval_roc_auc": 0.8745955707824836,
	"eval_runtime": 679.0864,
	"eval_samples_per_second": 4.22,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 3562
	},
	{
	"epoch": 14.0,
	"eval_accuracy": 0.5041870202372645,
	"eval_f1_macro": 0.6697333276095331,
	"eval_f1_micro": 0.8079378774805867,
	"eval_loss": 0.11155486851930618,
	"eval_roc_auc": 0.8750976636196655,
	"eval_runtime": 676.6891,
	"eval_samples_per_second": 4.235,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 3836
	},
	{
	"epoch": 14.6,
	"learning_rate": 0.001,
	"loss": 0.133,
	"step": 4000
	},
	{
	"epoch": 15.0,
	"eval_accuracy": 0.5181437543614794,
	"eval_f1_macro": 0.6736053030113935,
	"eval_f1_micro": 0.814943326393708,
	"eval_loss": 0.10734836012125015,
	"eval_roc_auc": 0.877205285207194,
	"eval_runtime": 677.4924,
	"eval_samples_per_second": 4.23,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 4110
	},
	{
	"epoch": 16.0,
	"eval_accuracy": 0.5083740404745289,
	"eval_f1_macro": 0.7055616874566738,
	"eval_f1_micro": 0.8238276299112801,
	"eval_loss": 0.10476414114236832,
	"eval_roc_auc": 0.8975418625131631,
	"eval_runtime": 687.0217,
	"eval_samples_per_second": 4.172,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.001,
	"step": 4384
	},
	{
	"epoch": 16.42,
	"learning_rate": 0.001,
	"loss": 0.1289,
	"step": 4500
	},
	{
	"epoch": 17.0,
	"eval_accuracy": 0.5244242847173761,
	"eval_f1_macro": 0.6896485755961196,
	"eval_f1_micro": 0.820858825547487,
	"eval_loss": 0.10253454744815826,
	"eval_roc_auc": 0.8839468587595108,
	"eval_runtime": 684.6037,
	"eval_samples_per_second": 4.186,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.001,
	"step": 4658
	},
	{
	"epoch": 18.0,
	"eval_accuracy": 0.5321004884856944,
	"eval_f1_macro": 0.7045003592264228,
	"eval_f1_micro": 0.8289563051845145,
	"eval_loss": 0.10259302705526352,
	"eval_roc_auc": 0.8916264271206406,
	"eval_runtime": 685.7262,
	"eval_samples_per_second": 4.18,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.001,
	"step": 4932
	},
	{
	"epoch": 18.25,
	"learning_rate": 0.001,
	"loss": 0.1227,
	"step": 5000
	},
	{
	"epoch": 19.0,
	"eval_accuracy": 0.5279134682484299,
	"eval_f1_macro": 0.6905367219275804,
	"eval_f1_micro": 0.8306010928961749,
	"eval_loss": 0.10123815387487411,
	"eval_roc_auc": 0.8940566516497492,
	"eval_runtime": 685.5377,
	"eval_samples_per_second": 4.181,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.001,
	"step": 5206
	},
	{
	"epoch": 20.0,
	"eval_accuracy": 0.5216329378925332,
	"eval_f1_macro": 0.6830881274898382,
	"eval_f1_micro": 0.8280441143371596,
	"eval_loss": 0.09970748424530029,
	"eval_roc_auc": 0.8930346669934526,
	"eval_runtime": 686.9199,
	"eval_samples_per_second": 4.172,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.001,
	"step": 5480
	},
	{
	"epoch": 20.07,
	"learning_rate": 0.001,
	"loss": 0.1202,
	"step": 5500
	},
	{
	"epoch": 21.0,
	"eval_accuracy": 0.5352407536636427,
	"eval_f1_macro": 0.6926783323821563,
	"eval_f1_micro": 0.8300336623495178,
	"eval_loss": 0.09886988252401352,
	"eval_roc_auc": 0.8896211857387517,
	"eval_runtime": 684.9162,
	"eval_samples_per_second": 4.184,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.001,
	"step": 5754
	},
	{
	"epoch": 21.9,
	"learning_rate": 0.001,
	"loss": 0.12,
	"step": 6000
	},
	{
	"epoch": 22.0,
	"eval_accuracy": 0.5209351011863224,
	"eval_f1_macro": 0.6961228606859606,
	"eval_f1_micro": 0.8279826958105646,
	"eval_loss": 0.09963646531105042,
	"eval_roc_auc": 0.8892587586568824,
	"eval_runtime": 686.1389,
	"eval_samples_per_second": 4.177,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.001,
	"step": 6028
	},
	{
	"epoch": 23.0,
	"eval_accuracy": 0.5195394277739009,
	"eval_f1_macro": 0.6958628426894405,
	"eval_f1_micro": 0.831919078392807,
	"eval_loss": 0.09720779210329056,
	"eval_roc_auc": 0.8955944894582717,
	"eval_runtime": 693.3459,
	"eval_samples_per_second": 4.134,
	"eval_steps_per_second": 0.13,
	"learning_rate": 0.001,
	"step": 6302
	},
	{
	"epoch": 23.72,
	"learning_rate": 0.001,
	"loss": 0.1179,
	"step": 6500
	},
	{
	"epoch": 24.0,
	"eval_accuracy": 0.5212840195394278,
	"eval_f1_macro": 0.6881053152313114,
	"eval_f1_micro": 0.8270608813406306,
	"eval_loss": 0.10082241147756577,
	"eval_roc_auc": 0.8915954736236973,
	"eval_runtime": 682.9894,
	"eval_samples_per_second": 4.196,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.001,
	"step": 6576
	},
	{
	"epoch": 25.0,
	"eval_accuracy": 0.5268667131891137,
	"eval_f1_macro": 0.6859679989625925,
	"eval_f1_micro": 0.8283316086006668,
	"eval_loss": 0.09828384965658188,
	"eval_roc_auc": 0.8862551588199984,
	"eval_runtime": 673.7378,
	"eval_samples_per_second": 4.254,
	"eval_steps_per_second": 0.134,
	"learning_rate": 0.001,
	"step": 6850
	},
	{
	"epoch": 25.55,
	"learning_rate": 0.001,
	"loss": 0.1166,
	"step": 7000
	},
	{
	"epoch": 26.0,
	"eval_accuracy": 0.5310537334263782,
	"eval_f1_macro": 0.6805616825898689,
	"eval_f1_micro": 0.8284274424464553,
	"eval_loss": 0.09853371977806091,
	"eval_roc_auc": 0.8875551335725609,
	"eval_runtime": 679.0226,
	"eval_samples_per_second": 4.221,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 7124
	},
	{
	"epoch": 27.0,
	"eval_accuracy": 0.5324494068387997,
	"eval_f1_macro": 0.6901040821549612,
	"eval_f1_micro": 0.8305464575073264,
	"eval_loss": 0.09571811556816101,
	"eval_roc_auc": 0.887615396252071,
	"eval_runtime": 672.1908,
	"eval_samples_per_second": 4.264,
	"eval_steps_per_second": 0.134,
	"learning_rate": 0.001,
	"step": 7398
	},
	{
	"epoch": 27.37,
	"learning_rate": 0.001,
	"loss": 0.1158,
	"step": 7500
	},
	{
	"epoch": 28.0,
	"eval_accuracy": 0.5177948360083741,
	"eval_f1_macro": 0.7054421966314011,
	"eval_f1_micro": 0.8292325882551658,
	"eval_loss": 0.09954769909381866,
	"eval_roc_auc": 0.8934873150088631,
	"eval_runtime": 681.7881,
	"eval_samples_per_second": 4.204,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.001,
	"step": 7672
	},
	{
	"epoch": 29.0,
	"eval_accuracy": 0.5334961618981159,
	"eval_f1_macro": 0.7026467347883069,
	"eval_f1_micro": 0.8363861804655357,
	"eval_loss": 0.09332505613565445,
	"eval_roc_auc": 0.8970916521216963,
	"eval_runtime": 684.6938,
	"eval_samples_per_second": 4.186,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.001,
	"step": 7946
	},
	{
	"epoch": 29.2,
	"learning_rate": 0.001,
	"loss": 0.114,
	"step": 8000
	},
	{
	"epoch": 30.0,
	"eval_accuracy": 0.5258199581297976,
	"eval_f1_macro": 0.7109768073155117,
	"eval_f1_micro": 0.8351258454374099,
	"eval_loss": 0.09473367780447006,
	"eval_roc_auc": 0.901874991489952,
	"eval_runtime": 677.918,
	"eval_samples_per_second": 4.228,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 8220
	},
	{
	"epoch": 31.0,
	"eval_accuracy": 0.5331472435450104,
	"eval_f1_macro": 0.7175382540523837,
	"eval_f1_micro": 0.8365119611950171,
	"eval_loss": 0.09674925357103348,
	"eval_roc_auc": 0.9045853985344947,
	"eval_runtime": 675.0971,
	"eval_samples_per_second": 4.245,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 8494
	},
	{
	"epoch": 31.02,
	"learning_rate": 0.001,
	"loss": 0.1134,
	"step": 8500
	},
	{
	"epoch": 32.0,
	"eval_accuracy": 0.5324494068387997,
	"eval_f1_macro": 0.6932594476375145,
	"eval_f1_micro": 0.8353541076487252,
	"eval_loss": 0.09490892291069031,
	"eval_roc_auc": 0.8947967085095635,
	"eval_runtime": 677.2028,
	"eval_samples_per_second": 4.232,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 8768
	},
	{
	"epoch": 32.85,
	"learning_rate": 0.001,
	"loss": 0.113,
	"step": 9000
	},
	{
	"epoch": 33.0,
	"eval_accuracy": 0.5362875087229588,
	"eval_f1_macro": 0.6973292248077614,
	"eval_f1_micro": 0.8367208672086721,
	"eval_loss": 0.09511947631835938,
	"eval_roc_auc": 0.8966987186810037,
	"eval_runtime": 679.2015,
	"eval_samples_per_second": 4.22,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 9042
	},
	{
	"epoch": 34.0,
	"eval_accuracy": 0.5380321004884857,
	"eval_f1_macro": 0.6878227037845351,
	"eval_f1_micro": 0.8334680679062246,
	"eval_loss": 0.09364539384841919,
	"eval_roc_auc": 0.8876181367760314,
	"eval_runtime": 675.0346,
	"eval_samples_per_second": 4.246,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 9316
	},
	{
	"epoch": 34.67,
	"learning_rate": 0.001,
	"loss": 0.1124,
	"step": 9500
	},
	{
	"epoch": 35.0,
	"eval_accuracy": 0.5310537334263782,
	"eval_f1_macro": 0.6856042645068489,
	"eval_f1_micro": 0.833974649162517,
	"eval_loss": 0.09358564764261246,
	"eval_roc_auc": 0.8944494841237697,
	"eval_runtime": 678.2782,
	"eval_samples_per_second": 4.225,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.001,
	"step": 9590
	},
	{
	"epoch": 36.0,
	"eval_accuracy": 0.5453593859036985,
	"eval_f1_macro": 0.729828782855425,
	"eval_f1_micro": 0.8455960879096174,
	"eval_loss": 0.09342356771230698,
	"eval_roc_auc": 0.9030647539078717,
	"eval_runtime": 674.7512,
	"eval_samples_per_second": 4.247,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 9864
	},
	{
	"epoch": 36.5,
	"learning_rate": 0.0001,
	"loss": 0.1083,
	"step": 10000
	},
	{
	"epoch": 37.0,
	"eval_accuracy": 0.54675505931612,
	"eval_f1_macro": 0.7188765655113909,
	"eval_f1_micro": 0.8456650022696323,
	"eval_loss": 0.09240464121103287,
	"eval_roc_auc": 0.8999478550409371,
	"eval_runtime": 674.676,
	"eval_samples_per_second": 4.248,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 10138
	},
	{
	"epoch": 38.0,
	"eval_accuracy": 0.5450104675505931,
	"eval_f1_macro": 0.7089159960142193,
	"eval_f1_micro": 0.8449173647271904,
	"eval_loss": 0.09147636592388153,
	"eval_roc_auc": 0.9003695495594045,
	"eval_runtime": 675.4085,
	"eval_samples_per_second": 4.243,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 10412
	},
	{
	"epoch": 38.32,
	"learning_rate": 0.0001,
	"loss": 0.1034,
	"step": 10500
	},
	{
	"epoch": 39.0,
	"eval_accuracy": 0.5484996510816469,
	"eval_f1_macro": 0.725215575661352,
	"eval_f1_micro": 0.8487853799866281,
	"eval_loss": 0.09022974222898483,
	"eval_roc_auc": 0.9078051247451889,
	"eval_runtime": 672.7306,
	"eval_samples_per_second": 4.26,
	"eval_steps_per_second": 0.134,
	"learning_rate": 0.0001,
	"step": 10686
	},
	{
	"epoch": 40.0,
	"eval_accuracy": 0.5495464061409631,
	"eval_f1_macro": 0.7182446688615595,
	"eval_f1_micro": 0.8458797579322437,
	"eval_loss": 0.09058264642953873,
	"eval_roc_auc": 0.9011424061638826,
	"eval_runtime": 678.9298,
	"eval_samples_per_second": 4.221,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 10960
	},
	{
	"epoch": 40.15,
	"learning_rate": 0.0001,
	"loss": 0.1024,
	"step": 11000
	},
	{
	"epoch": 41.0,
	"eval_accuracy": 0.5505931612002791,
	"eval_f1_macro": 0.7130026819185953,
	"eval_f1_micro": 0.8481005491705826,
	"eval_loss": 0.08943015336990356,
	"eval_roc_auc": 0.902018393012137,
	"eval_runtime": 676.4356,
	"eval_samples_per_second": 4.237,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 11234
	},
	{
	"epoch": 41.97,
	"learning_rate": 0.0001,
	"loss": 0.1004,
	"step": 11500
	},
	{
	"epoch": 42.0,
	"eval_accuracy": 0.5519888346127007,
	"eval_f1_macro": 0.7148190184347656,
	"eval_f1_micro": 0.8457012282205084,
	"eval_loss": 0.08726447820663452,
	"eval_roc_auc": 0.8977194051943719,
	"eval_runtime": 677.9496,
	"eval_samples_per_second": 4.227,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 11508
	},
	{
	"epoch": 43.0,
	"eval_accuracy": 0.5537334263782275,
	"eval_f1_macro": 0.71816969331258,
	"eval_f1_micro": 0.8494563389754511,
	"eval_loss": 0.08699071407318115,
	"eval_roc_auc": 0.906163507621426,
	"eval_runtime": 676.5268,
	"eval_samples_per_second": 4.236,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 11782
	},
	{
	"epoch": 43.8,
	"learning_rate": 0.0001,
	"loss": 0.0998,
	"step": 12000
	},
	{
	"epoch": 44.0,
	"eval_accuracy": 0.5498953244940684,
	"eval_f1_macro": 0.7261208407998851,
	"eval_f1_micro": 0.8486114247008355,
	"eval_loss": 0.08676985651254654,
	"eval_roc_auc": 0.9033042612782081,
	"eval_runtime": 674.6536,
	"eval_samples_per_second": 4.248,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 12056
	},
	{
	"epoch": 45.0,
	"eval_accuracy": 0.555129099790649,
	"eval_f1_macro": 0.7235580263821535,
	"eval_f1_micro": 0.8493258426966293,
	"eval_loss": 0.08680889010429382,
	"eval_roc_auc": 0.9052931027877648,
	"eval_runtime": 688.2557,
	"eval_samples_per_second": 4.164,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 12330
	},
	{
	"epoch": 45.62,
	"learning_rate": 0.0001,
	"loss": 0.0975,
	"step": 12500
	},
	{
	"epoch": 46.0,
	"eval_accuracy": 0.5512909979064898,
	"eval_f1_macro": 0.7317716716296281,
	"eval_f1_micro": 0.8489586241554526,
	"eval_loss": 0.0865492969751358,
	"eval_roc_auc": 0.9071607698668371,
	"eval_runtime": 684.0678,
	"eval_samples_per_second": 4.19,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.0001,
	"step": 12604
	},
	{
	"epoch": 47.0,
	"eval_accuracy": 0.5547801814375436,
	"eval_f1_macro": 0.7390020274567815,
	"eval_f1_micro": 0.8512299882858259,
	"eval_loss": 0.08599700033664703,
	"eval_roc_auc": 0.908765101440927,
	"eval_runtime": 688.2365,
	"eval_samples_per_second": 4.164,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 12878
	},
	{
	"epoch": 47.45,
	"learning_rate": 0.0001,
	"loss": 0.099,
	"step": 13000
	},
	{
	"epoch": 48.0,
	"eval_accuracy": 0.5558269364968598,
	"eval_f1_macro": 0.7360003523455093,
	"eval_f1_micro": 0.8509512552065742,
	"eval_loss": 0.08596429973840714,
	"eval_roc_auc": 0.9055422308395834,
	"eval_runtime": 686.3198,
	"eval_samples_per_second": 4.176,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 13152
	},
	{
	"epoch": 49.0,
	"eval_accuracy": 0.5547801814375436,
	"eval_f1_macro": 0.7361919298080869,
	"eval_f1_micro": 0.849985959000281,
	"eval_loss": 0.08584348857402802,
	"eval_roc_auc": 0.9057525299940252,
	"eval_runtime": 688.3813,
	"eval_samples_per_second": 4.163,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 13426
	},
	{
	"epoch": 49.27,
	"learning_rate": 0.0001,
	"loss": 0.0972,
	"step": 13500
	},
	{
	"epoch": 50.0,
	"eval_accuracy": 0.5586182833217027,
	"eval_f1_macro": 0.725712332481399,
	"eval_f1_micro": 0.8505096262740656,
	"eval_loss": 0.08557379245758057,
	"eval_roc_auc": 0.9032805341102342,
	"eval_runtime": 685.8179,
	"eval_samples_per_second": 4.179,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 13700
	},
	{
	"epoch": 51.0,
	"eval_accuracy": 0.557920446615492,
	"eval_f1_macro": 0.7408593608052999,
	"eval_f1_micro": 0.8500254194204373,
	"eval_loss": 0.08562461286783218,
	"eval_roc_auc": 0.9038335718454608,
	"eval_runtime": 683.3234,
	"eval_samples_per_second": 4.194,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.0001,
	"step": 13974
	},
	{
	"epoch": 51.09,
	"learning_rate": 0.0001,
	"loss": 0.0957,
	"step": 14000
	},
	{
	"epoch": 52.0,
	"eval_accuracy": 0.5568736915561758,
	"eval_f1_macro": 0.7232142709265429,
	"eval_f1_micro": 0.8507868221442318,
	"eval_loss": 0.08591117709875107,
	"eval_roc_auc": 0.9035466101391771,
	"eval_runtime": 693.4248,
	"eval_samples_per_second": 4.133,
	"eval_steps_per_second": 0.13,
	"learning_rate": 0.0001,
	"step": 14248
	},
	{
	"epoch": 52.92,
	"learning_rate": 0.0001,
	"loss": 0.0964,
	"step": 14500
	},
	{
	"epoch": 53.0,
	"eval_accuracy": 0.5628053035589672,
	"eval_f1_macro": 0.7275870481420489,
	"eval_f1_micro": 0.852056338028169,
	"eval_loss": 0.08490145951509476,
	"eval_roc_auc": 0.9058454914515268,
	"eval_runtime": 691.5127,
	"eval_samples_per_second": 4.145,
	"eval_steps_per_second": 0.13,
	"learning_rate": 0.0001,
	"step": 14522
	},
	{
	"epoch": 54.0,
	"eval_accuracy": 0.5537334263782275,
	"eval_f1_macro": 0.7394514344990791,
	"eval_f1_micro": 0.85390386218394,
	"eval_loss": 0.08516541868448257,
	"eval_roc_auc": 0.9115532672468961,
	"eval_runtime": 698.0325,
	"eval_samples_per_second": 4.106,
	"eval_steps_per_second": 0.129,
	"learning_rate": 0.0001,
	"step": 14796
	},
	{
	"epoch": 54.74,
	"learning_rate": 0.0001,
	"loss": 0.0955,
	"step": 15000
	},
	{
	"epoch": 55.0,
	"eval_accuracy": 0.5565247732030705,
	"eval_f1_macro": 0.7354184764103003,
	"eval_f1_micro": 0.8511167656205825,
	"eval_loss": 0.08514942973852158,
	"eval_roc_auc": 0.904089479088129,
	"eval_runtime": 681.3519,
	"eval_samples_per_second": 4.206,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.0001,
	"step": 15070
	},
	{
	"epoch": 56.0,
	"eval_accuracy": 0.5572226099092812,
	"eval_f1_macro": 0.736739641327092,
	"eval_f1_micro": 0.8529461421576904,
	"eval_loss": 0.08491206169128418,
	"eval_roc_auc": 0.9066984002032717,
	"eval_runtime": 677.9791,
	"eval_samples_per_second": 4.227,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 15344
	},
	{
	"epoch": 56.57,
	"learning_rate": 0.0001,
	"loss": 0.095,
	"step": 15500
	},
	{
	"epoch": 57.0,
	"eval_accuracy": 0.5537334263782275,
	"eval_f1_macro": 0.7241830253482859,
	"eval_f1_micro": 0.8493824336688013,
	"eval_loss": 0.0848437026143074,
	"eval_roc_auc": 0.8993941682342463,
	"eval_runtime": 677.1333,
	"eval_samples_per_second": 4.233,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 15618
	},
	{
	"epoch": 58.0,
	"eval_accuracy": 0.5593161200279134,
	"eval_f1_macro": 0.7363418087082886,
	"eval_f1_micro": 0.8511604153662826,
	"eval_loss": 0.08454328030347824,
	"eval_roc_auc": 0.9029315644433922,
	"eval_runtime": 675.3593,
	"eval_samples_per_second": 4.244,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 15892
	},
	{
	"epoch": 58.39,
	"learning_rate": 0.0001,
	"loss": 0.093,
	"step": 16000
	},
	{
	"epoch": 59.0,
	"eval_accuracy": 0.560711793440335,
	"eval_f1_macro": 0.73901392865669,
	"eval_f1_micro": 0.8530955471527739,
	"eval_loss": 0.08396653085947037,
	"eval_roc_auc": 0.9058246057741859,
	"eval_runtime": 679.8275,
	"eval_samples_per_second": 4.216,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.0001,
	"step": 16166
	},
	{
	"epoch": 60.0,
	"eval_accuracy": 0.5561758548499651,
	"eval_f1_macro": 0.7472770304573509,
	"eval_f1_micro": 0.852848189028787,
	"eval_loss": 0.08474517613649368,
	"eval_roc_auc": 0.9116141789978706,
	"eval_runtime": 679.8207,
	"eval_samples_per_second": 4.216,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.0001,
	"step": 16440
	},
	{
	"epoch": 60.22,
	"learning_rate": 0.0001,
	"loss": 0.0936,
	"step": 16500
	},
	{
	"epoch": 61.0,
	"eval_accuracy": 0.552337752965806,
	"eval_f1_macro": 0.7425280881449604,
	"eval_f1_micro": 0.8516569637259293,
	"eval_loss": 0.08434043824672699,
	"eval_roc_auc": 0.9078005379735077,
	"eval_runtime": 678.8837,
	"eval_samples_per_second": 4.222,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 16714
	},
	{
	"epoch": 62.0,
	"eval_accuracy": 0.5540823447313329,
	"eval_f1_macro": 0.7455853496732745,
	"eval_f1_micro": 0.8515365097265295,
	"eval_loss": 0.08436089754104614,
	"eval_roc_auc": 0.905273313320008,
	"eval_runtime": 684.8061,
	"eval_samples_per_second": 4.185,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 16988
	},
	{
	"epoch": 62.04,
	"learning_rate": 0.0001,
	"loss": 0.0932,
	"step": 17000
	},
	{
	"epoch": 63.0,
	"eval_accuracy": 0.5575715282623867,
	"eval_f1_macro": 0.7344319075168565,
	"eval_f1_micro": 0.8535319341006545,
	"eval_loss": 0.0839960053563118,
	"eval_roc_auc": 0.9061600170593289,
	"eval_runtime": 676.8011,
	"eval_samples_per_second": 4.235,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 17262
	},
	{
	"epoch": 63.87,
	"learning_rate": 0.0001,
	"loss": 0.0933,
	"step": 17500
	},
	{
	"epoch": 64.0,
	"eval_accuracy": 0.5614096301465457,
	"eval_f1_macro": 0.7405199466064576,
	"eval_f1_micro": 0.8543109759531453,
	"eval_loss": 0.08395348489284515,
	"eval_roc_auc": 0.907220383474883,
	"eval_runtime": 676.0097,
	"eval_samples_per_second": 4.24,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 17536
	},
	{
	"epoch": 65.0,
	"eval_accuracy": 0.557920446615492,
	"eval_f1_macro": 0.7354221702015719,
	"eval_f1_micro": 0.8506689439225733,
	"eval_loss": 0.08403661847114563,
	"eval_roc_auc": 0.9015583167344123,
	"eval_runtime": 675.0487,
	"eval_samples_per_second": 4.246,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 17810
	},
	{
	"epoch": 65.69,
	"learning_rate": 0.0001,
	"loss": 0.0921,
	"step": 18000
	},
	{
	"epoch": 66.0,
	"eval_accuracy": 0.5568736915561758,
	"eval_f1_macro": 0.7296578358578595,
	"eval_f1_micro": 0.852865023077789,
	"eval_loss": 0.08408054709434509,
	"eval_roc_auc": 0.9065963661690798,
	"eval_runtime": 680.0166,
	"eval_samples_per_second": 4.215,
	"eval_steps_per_second": 0.132,
	"learning_rate": 0.0001,
	"step": 18084
	},
	{
	"epoch": 67.0,
	"eval_accuracy": 0.5540823447313329,
	"eval_f1_macro": 0.7392975848141861,
	"eval_f1_micro": 0.8539689628223736,
	"eval_loss": 0.08376849442720413,
	"eval_roc_auc": 0.9100385075348831,
	"eval_runtime": 675.941,
	"eval_samples_per_second": 4.24,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 18358
	},
	{
	"epoch": 67.52,
	"learning_rate": 0.0001,
	"loss": 0.0913,
	"step": 18500
	},
	{
	"epoch": 68.0,
	"eval_accuracy": 0.5572226099092812,
	"eval_f1_macro": 0.7403483881006915,
	"eval_f1_micro": 0.854102492299076,
	"eval_loss": 0.08355987071990967,
	"eval_roc_auc": 0.9089826269243382,
	"eval_runtime": 676.7975,
	"eval_samples_per_second": 4.235,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 18632
	},
	{
	"epoch": 69.0,
	"eval_accuracy": 0.5582693649685974,
	"eval_f1_macro": 0.7494443807338856,
	"eval_f1_micro": 0.8547792062604807,
	"eval_loss": 0.08346723765134811,
	"eval_roc_auc": 0.9100283387486087,
	"eval_runtime": 675.2406,
	"eval_samples_per_second": 4.244,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 18906
	},
	{
	"epoch": 69.34,
	"learning_rate": 0.0001,
	"loss": 0.0911,
	"step": 19000
	},
	{
	"epoch": 70.0,
	"eval_accuracy": 0.5561758548499651,
	"eval_f1_macro": 0.7486606655073544,
	"eval_f1_micro": 0.8551793496480055,
	"eval_loss": 0.08306006342172623,
	"eval_roc_auc": 0.9104037761073852,
	"eval_runtime": 675.6626,
	"eval_samples_per_second": 4.242,
	"eval_steps_per_second": 0.133,
	"learning_rate": 0.0001,
	"step": 19180
	},
	{
	"epoch": 71.0,
	"eval_accuracy": 0.557920446615492,
	"eval_f1_macro": 0.74841480686329,
	"eval_f1_micro": 0.8557041347283614,
	"eval_loss": 0.08348394185304642,
	"eval_roc_auc": 0.9102149107350765,
	"eval_runtime": 688.9991,
	"eval_samples_per_second": 4.16,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 19454
	},
	{
	"epoch": 71.17,
	"learning_rate": 0.0001,
	"loss": 0.0907,
	"step": 19500
	},
	{
	"epoch": 72.0,
	"eval_accuracy": 0.5610607117934403,
	"eval_f1_macro": 0.7445560004670461,
	"eval_f1_micro": 0.8531667140017041,
	"eval_loss": 0.08317266404628754,
	"eval_roc_auc": 0.9036835353705291,
	"eval_runtime": 686.0467,
	"eval_samples_per_second": 4.178,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 19728
	},
	{
	"epoch": 72.99,
	"learning_rate": 0.0001,
	"loss": 0.0905,
	"step": 20000
	},
	{
	"epoch": 73.0,
	"eval_accuracy": 0.5575715282623867,
	"eval_f1_macro": 0.7511661878734329,
	"eval_f1_micro": 0.8557848235754626,
	"eval_loss": 0.0826636552810669,
	"eval_roc_auc": 0.9104516775814524,
	"eval_runtime": 696.2462,
	"eval_samples_per_second": 4.116,
	"eval_steps_per_second": 0.129,
	"learning_rate": 0.0001,
	"step": 20002
	},
	{
	"epoch": 74.0,
	"eval_accuracy": 0.5589672016748081,
	"eval_f1_macro": 0.7519078199055363,
	"eval_f1_micro": 0.8547880690737834,
	"eval_loss": 0.08345863223075867,
	"eval_roc_auc": 0.9089978296204139,
	"eval_runtime": 684.5044,
	"eval_samples_per_second": 4.187,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 20276
	},
	{
	"epoch": 74.82,
	"learning_rate": 0.0001,
	"loss": 0.0896,
	"step": 20500
	},
	{
	"epoch": 75.0,
	"eval_accuracy": 0.5565247732030705,
	"eval_f1_macro": 0.7427640048071817,
	"eval_f1_micro": 0.8535384963511908,
	"eval_loss": 0.08291995525360107,
	"eval_roc_auc": 0.9052642407433178,
	"eval_runtime": 693.0369,
	"eval_samples_per_second": 4.135,
	"eval_steps_per_second": 0.13,
	"learning_rate": 0.0001,
	"step": 20550
	},
	{
	"epoch": 76.0,
	"eval_accuracy": 0.5642009769713887,
	"eval_f1_macro": 0.7449358839801685,
	"eval_f1_micro": 0.8560516708789666,
	"eval_loss": 0.08278567343950272,
	"eval_roc_auc": 0.9091009598641902,
	"eval_runtime": 689.5027,
	"eval_samples_per_second": 4.157,
	"eval_steps_per_second": 0.131,
	"learning_rate": 0.0001,
	"step": 20824
	},
	{
	"epoch": 76.64,
	"learning_rate": 0.0001,
	"loss": 0.089,
	"step": 21000
	},
	{
	"epoch": 77.0,
	"eval_accuracy": 0.5603628750872296,
	"eval_f1_macro": 0.7507123347472292,
	"eval_f1_micro": 0.8567585743106928,
	"eval_loss": 0.08268015086650848,
	"eval_roc_auc": 0.9102413784270108,
	"eval_runtime": 691.3385,
	"eval_samples_per_second": 4.146,
	"eval_steps_per_second": 0.13,
	"learning_rate": 0.0001,
	"step": 21098
	},
	{
	"epoch": 78.0,
	"eval_accuracy": 0.557920446615492,
	"eval_f1_macro": 0.7435504236075495,
	"eval_f1_micro": 0.8528667079277555,
	"eval_loss": 0.0833190307021141,
	"eval_roc_auc": 0.9067310989812636,
	"eval_runtime": 698.1968,
	"eval_samples_per_second": 4.105,
	"eval_steps_per_second": 0.129,
	"learning_rate": 0.0001,
	"step": 21372
	},
	{
	"epoch": 78.47,
	"learning_rate": 0.0001,
	"loss": 0.0892,
	"step": 21500
	},
	{
	"epoch": 79.0,
	"eval_accuracy": 0.5589672016748081,
	"eval_f1_macro": 0.7501683098189544,
	"eval_f1_micro": 0.8540393754243042,
	"eval_loss": 0.08301213383674622,
	"eval_roc_auc": 0.905519599881194,
	"eval_runtime": 693.3725,
	"eval_samples_per_second": 4.133,
	"eval_steps_per_second": 0.13,
	"learning_rate": 0.0001,
	"step": 21646
	},
	{
	"epoch": 80.0,
	"eval_accuracy": 0.5600139567341242,
	"eval_f1_macro": 0.7461247141006309,
	"eval_f1_micro": 0.8548240635641317,
	"eval_loss": 0.08266153186559677,
	"eval_roc_auc": 0.9048757931076342,
	"eval_runtime": 692.1533,
	"eval_samples_per_second": 4.141,
	"eval_steps_per_second": 0.13,
	"learning_rate": 1e-05,
	"step": 21920
	},
	{
	"epoch": 80.29,
	"learning_rate": 1e-05,
	"loss": 0.0879,
	"step": 22000
	},
	{
	"epoch": 81.0,
	"eval_accuracy": 0.560711793440335,
	"eval_f1_macro": 0.7542778186740821,
	"eval_f1_micro": 0.8576379185065117,
	"eval_loss": 0.08230110257863998,
	"eval_roc_auc": 0.9116332184274908,
	"eval_runtime": 691.9752,
	"eval_samples_per_second": 4.142,
	"eval_steps_per_second": 0.13,
	"learning_rate": 1e-05,
	"step": 22194
	},
	{
	"epoch": 82.0,
	"eval_accuracy": 0.5631542219120725,
	"eval_f1_macro": 0.7536111063550082,
	"eval_f1_micro": 0.8576225654801881,
	"eval_loss": 0.08222728967666626,
	"eval_roc_auc": 0.9111816666216643,
	"eval_runtime": 688.2687,
	"eval_samples_per_second": 4.164,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 22468
	},
	{
	"epoch": 82.12,
	"learning_rate": 1e-05,
	"loss": 0.0867,
	"step": 22500
	},
	{
	"epoch": 83.0,
	"eval_accuracy": 0.5624563852058618,
	"eval_f1_macro": 0.7519980936807484,
	"eval_f1_micro": 0.8553623024191264,
	"eval_loss": 0.08224428445100784,
	"eval_roc_auc": 0.9057647902327958,
	"eval_runtime": 675.1087,
	"eval_samples_per_second": 4.245,
	"eval_steps_per_second": 0.133,
	"learning_rate": 1e-05,
	"step": 22742
	},
	{
	"epoch": 83.94,
	"learning_rate": 1e-05,
	"loss": 0.0864,
	"step": 23000
	},
	{
	"epoch": 84.0,
	"eval_accuracy": 0.5638520586182834,
	"eval_f1_macro": 0.751088987860079,
	"eval_f1_micro": 0.8550642905481616,
	"eval_loss": 0.08214889466762543,
	"eval_roc_auc": 0.9071555340236915,
	"eval_runtime": 684.6287,
	"eval_samples_per_second": 4.186,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 23016
	},
	{
	"epoch": 85.0,
	"eval_accuracy": 0.5617585484996511,
	"eval_f1_macro": 0.7532850236770345,
	"eval_f1_micro": 0.8560117633751838,
	"eval_loss": 0.08197268098592758,
	"eval_roc_auc": 0.9067157953185159,
	"eval_runtime": 685.9962,
	"eval_samples_per_second": 4.178,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 23290
	},
	{
	"epoch": 85.77,
	"learning_rate": 1e-05,
	"loss": 0.0865,
	"step": 23500
	},
	{
	"epoch": 86.0,
	"eval_accuracy": 0.5600139567341242,
	"eval_f1_macro": 0.7495768803790436,
	"eval_f1_micro": 0.8553152949167893,
	"eval_loss": 0.0821395218372345,
	"eval_roc_auc": 0.9060269285615214,
	"eval_runtime": 676.0683,
	"eval_samples_per_second": 4.239,
	"eval_steps_per_second": 0.133,
	"learning_rate": 1e-05,
	"step": 23564
	},
	{
	"epoch": 87.0,
	"eval_accuracy": 0.5586182833217027,
	"eval_f1_macro": 0.7518865385404515,
	"eval_f1_micro": 0.8558878188883257,
	"eval_loss": 0.08169202506542206,
	"eval_roc_auc": 0.9080884949227034,
	"eval_runtime": 683.932,
	"eval_samples_per_second": 4.19,
	"eval_steps_per_second": 0.132,
	"learning_rate": 1e-05,
	"step": 23838
	},
	{
	"epoch": 87.59,
	"learning_rate": 1e-05,
	"loss": 0.0868,
	"step": 24000
	},
	{
	"epoch": 88.0,
	"eval_accuracy": 0.5621074668527565,
	"eval_f1_macro": 0.7526313975322289,
	"eval_f1_micro": 0.8558239036198839,
	"eval_loss": 0.08171343803405762,
	"eval_roc_auc": 0.9081685470699702,
	"eval_runtime": 687.6304,
	"eval_samples_per_second": 4.168,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 24112
	},
	{
	"epoch": 89.0,
	"eval_accuracy": 0.5638520586182834,
	"eval_f1_macro": 0.7535945449960157,
	"eval_f1_micro": 0.8569978572234127,
	"eval_loss": 0.08180436491966248,
	"eval_roc_auc": 0.9082570227224631,
	"eval_runtime": 685.8987,
	"eval_samples_per_second": 4.178,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 24386
	},
	{
	"epoch": 89.42,
	"learning_rate": 1e-05,
	"loss": 0.0857,
	"step": 24500
	},
	{
	"epoch": 90.0,
	"eval_accuracy": 0.5617585484996511,
	"eval_f1_macro": 0.7521712775972677,
	"eval_f1_micro": 0.8557914296976182,
	"eval_loss": 0.08184907585382462,
	"eval_roc_auc": 0.9080738403314199,
	"eval_runtime": 2199.2107,
	"eval_samples_per_second": 1.303,
	"eval_steps_per_second": 0.041,
	"learning_rate": 1e-05,
	"step": 24660
	},
	{
	"epoch": 91.0,
	"eval_accuracy": 0.5631542219120725,
	"eval_f1_macro": 0.7496381590553177,
	"eval_f1_micro": 0.856868937514099,
	"eval_loss": 0.08175913989543915,
	"eval_roc_auc": 0.9081476613926293,
	"eval_runtime": 685.7142,
	"eval_samples_per_second": 4.18,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 24934
	},
	{
	"epoch": 91.24,
	"learning_rate": 1e-05,
	"loss": 0.0862,
	"step": 25000
	},
	{
	"epoch": 92.0,
	"eval_accuracy": 0.5648988136775994,
	"eval_f1_macro": 0.7551884126903309,
	"eval_f1_micro": 0.8566131025957974,
	"eval_loss": 0.08205177634954453,
	"eval_roc_auc": 0.9092762668547993,
	"eval_runtime": 688.0975,
	"eval_samples_per_second": 4.165,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 25208
	},
	{
	"epoch": 93.0,
	"eval_accuracy": 0.5628053035589672,
	"eval_f1_macro": 0.7579638727848569,
	"eval_f1_micro": 0.8588642195693407,
	"eval_loss": 0.08153587579727173,
	"eval_roc_auc": 0.9129889700545543,
	"eval_runtime": 686.4355,
	"eval_samples_per_second": 4.175,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 25482
	},
	{
	"epoch": 93.07,
	"learning_rate": 1e-05,
	"loss": 0.0851,
	"step": 25500
	},
	{
	"epoch": 94.0,
	"eval_accuracy": 0.5600139567341242,
	"eval_f1_macro": 0.7565755790887538,
	"eval_f1_micro": 0.8570630932439977,
	"eval_loss": 0.0816139355301857,
	"eval_roc_auc": 0.911680023691974,
	"eval_runtime": 686.9681,
	"eval_samples_per_second": 4.172,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 25756
	},
	{
	"epoch": 94.89,
	"learning_rate": 1e-05,
	"loss": 0.0854,
	"step": 26000
	},
	{
	"epoch": 95.0,
	"eval_accuracy": 0.5631542219120725,
	"eval_f1_macro": 0.7553215815461111,
	"eval_f1_micro": 0.8563582357226924,
	"eval_loss": 0.08153104782104492,
	"eval_roc_auc": 0.9100006738804182,
	"eval_runtime": 792.6719,
	"eval_samples_per_second": 3.616,
	"eval_steps_per_second": 0.114,
	"learning_rate": 1e-05,
	"step": 26030
	},
	{
	"epoch": 96.0,
	"eval_accuracy": 0.5621074668527565,
	"eval_f1_macro": 0.7584737150271473,
	"eval_f1_micro": 0.8576208800401539,
	"eval_loss": 0.081536203622818,
	"eval_roc_auc": 0.9123942619313182,
	"eval_runtime": 689.1211,
	"eval_samples_per_second": 4.159,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 26304
	},
	{
	"epoch": 96.72,
	"learning_rate": 1e-05,
	"loss": 0.0854,
	"step": 26500
	},
	{
	"epoch": 97.0,
	"eval_accuracy": 0.5628053035589672,
	"eval_f1_macro": 0.7578675241138624,
	"eval_f1_micro": 0.8575591168889387,
	"eval_loss": 0.0817214846611023,
	"eval_roc_auc": 0.9107227875201963,
	"eval_runtime": 791.8215,
	"eval_samples_per_second": 3.62,
	"eval_steps_per_second": 0.114,
	"learning_rate": 1e-05,
	"step": 26578
	},
	{
	"epoch": 98.0,
	"eval_accuracy": 0.5638520586182834,
	"eval_f1_macro": 0.7526862577512524,
	"eval_f1_micro": 0.8570947651910453,
	"eval_loss": 0.08161807805299759,
	"eval_roc_auc": 0.9100232038721354,
	"eval_runtime": 689.7672,
	"eval_samples_per_second": 4.155,
	"eval_steps_per_second": 0.13,
	"learning_rate": 1e-05,
	"step": 26852
	},
	{
	"epoch": 98.54,
	"learning_rate": 1e-05,
	"loss": 0.0855,
	"step": 27000
	},
	{
	"epoch": 99.0,
	"eval_accuracy": 0.5642009769713887,
	"eval_f1_macro": 0.7556285126609241,
	"eval_f1_micro": 0.8578035986237239,
	"eval_loss": 0.08184286206960678,
	"eval_roc_auc": 0.9086036990034648,
	"eval_runtime": 685.3364,
	"eval_samples_per_second": 4.182,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1e-05,
	"step": 27126
	},
	{
	"epoch": 100.0,
	"eval_accuracy": 0.5631542219120725,
	"eval_f1_macro": 0.753319281703831,
	"eval_f1_micro": 0.857062242537103,
	"eval_loss": 0.08161789923906326,
	"eval_roc_auc": 0.9080422377630124,
	"eval_runtime": 680.1579,
	"eval_samples_per_second": 4.214,
	"eval_steps_per_second": 0.132,
	"learning_rate": 1.0000000000000002e-06,
	"step": 27400
	},
	{
	"epoch": 100.36,
	"learning_rate": 1.0000000000000002e-06,
	"loss": 0.0837,
	"step": 27500
	},
	{
	"epoch": 101.0,
	"eval_accuracy": 0.5645498953244941,
	"eval_f1_macro": 0.7553159980269647,
	"eval_f1_micro": 0.8575286968264686,
	"eval_loss": 0.08142262697219849,
	"eval_roc_auc": 0.9092807526598085,
	"eval_runtime": 693.9432,
	"eval_samples_per_second": 4.13,
	"eval_steps_per_second": 0.13,
	"learning_rate": 1.0000000000000002e-06,
	"step": 27674
	},
	{
	"epoch": 102.0,
	"eval_accuracy": 0.5652477320307048,
	"eval_f1_macro": 0.7559444477928223,
	"eval_f1_micro": 0.8571749382438806,
	"eval_loss": 0.08143333345651627,
	"eval_roc_auc": 0.9098557722819599,
	"eval_runtime": 695.0171,
	"eval_samples_per_second": 4.124,
	"eval_steps_per_second": 0.129,
	"learning_rate": 1.0000000000000002e-06,
	"step": 27948
	},
	{
	"epoch": 102.19,
	"learning_rate": 1.0000000000000002e-06,
	"loss": 0.085,
	"step": 28000
	},
	{
	"epoch": 103.0,
	"eval_accuracy": 0.5645498953244941,
	"eval_f1_macro": 0.7565514506209431,
	"eval_f1_micro": 0.8570462613399448,
	"eval_loss": 0.08157742768526077,
	"eval_roc_auc": 0.9085338156424723,
	"eval_runtime": 710.2061,
	"eval_samples_per_second": 4.035,
	"eval_steps_per_second": 0.127,
	"learning_rate": 1.0000000000000002e-06,
	"step": 28222
	},
	{
	"epoch": 104.0,
	"eval_accuracy": 0.5645498953244941,
	"eval_f1_macro": 0.7572978759334409,
	"eval_f1_micro": 0.857623884617543,
	"eval_loss": 0.08124219626188278,
	"eval_roc_auc": 0.9102385369363781,
	"eval_runtime": 703.8703,
	"eval_samples_per_second": 4.072,
	"eval_steps_per_second": 0.128,
	"learning_rate": 1.0000000000000002e-06,
	"step": 28496
	},
	{
	"epoch": 104.01,
	"learning_rate": 1.0000000000000002e-06,
	"loss": 0.0844,
	"step": 28500
	},
	{
	"epoch": 105.0,
	"eval_accuracy": 0.5603628750872296,
	"eval_f1_macro": 0.7588882568234135,
	"eval_f1_micro": 0.8571747004736696,
	"eval_loss": 0.08170615136623383,
	"eval_roc_auc": 0.9124156957134514,
	"eval_runtime": 693.4706,
	"eval_samples_per_second": 4.133,
	"eval_steps_per_second": 0.13,
	"learning_rate": 1.0000000000000002e-06,
	"step": 28770
	},
	{
	"epoch": 105.84,
	"learning_rate": 1.0000000000000002e-06,
	"loss": 0.0845,
	"step": 29000
	},
	{
	"epoch": 106.0,
	"eval_accuracy": 0.5628053035589672,
	"eval_f1_macro": 0.7514055460147794,
	"eval_f1_micro": 0.8562891131532955,
	"eval_loss": 0.08144387602806091,
	"eval_roc_auc": 0.9079250010327448,
	"eval_runtime": 693.924,
	"eval_samples_per_second": 4.13,
	"eval_steps_per_second": 0.13,
	"learning_rate": 1.0000000000000002e-06,
	"step": 29044
	},
	{
	"epoch": 107.0,
	"eval_accuracy": 0.5635031402651779,
	"eval_f1_macro": 0.7490061784836257,
	"eval_f1_micro": 0.8557823129251702,
	"eval_loss": 0.08168599754571915,
	"eval_roc_auc": 0.9057833825242961,
	"eval_runtime": 697.3665,
	"eval_samples_per_second": 4.11,
	"eval_steps_per_second": 0.129,
	"learning_rate": 1.0000000000000002e-06,
	"step": 29318
	},
	{
	"epoch": 107.66,
	"learning_rate": 1.0000000000000002e-06,
	"loss": 0.0854,
	"step": 29500
	},
	{
	"epoch": 108.0,
	"eval_accuracy": 0.5642009769713887,
	"eval_f1_macro": 0.7569164155873785,
	"eval_f1_micro": 0.8569341425039335,
	"eval_loss": 0.08160943537950516,
	"eval_roc_auc": 0.9094149373671999,
	"eval_runtime": 692.7895,
	"eval_samples_per_second": 4.137,
	"eval_steps_per_second": 0.13,
	"learning_rate": 1.0000000000000002e-06,
	"step": 29592
	},
	{
	"epoch": 109.0,
	"eval_accuracy": 0.5652477320307048,
	"eval_f1_macro": 0.7558234898859766,
	"eval_f1_micro": 0.8573669467787115,
	"eval_loss": 0.08135490119457245,
	"eval_roc_auc": 0.9106934783376293,
	"eval_runtime": 695.7903,
	"eval_samples_per_second": 4.119,
	"eval_steps_per_second": 0.129,
	"learning_rate": 1.0000000000000002e-06,
	"step": 29866
	},
	{
	"epoch": 109.49,
	"learning_rate": 1.0000000000000002e-06,
	"loss": 0.0854,
	"step": 30000
	},
	{
	"epoch": 110.0,
	"eval_accuracy": 0.5638520586182834,
	"eval_f1_macro": 0.7564667466516518,
	"eval_f1_micro": 0.8577973962116557,
	"eval_loss": 0.08132224529981613,
	"eval_roc_auc": 0.9118372864958749,
	"eval_runtime": 682.0266,
	"eval_samples_per_second": 4.202,
	"eval_steps_per_second": 0.132,
	"learning_rate": 1.0000000000000002e-06,
	"step": 30140
	},
	{
	"epoch": 111.0,
	"eval_accuracy": 0.5638520586182834,
	"eval_f1_macro": 0.7579481466413214,
	"eval_f1_micro": 0.8576381122791322,
	"eval_loss": 0.0814104825258255,
	"eval_roc_auc": 0.911498485615307,
	"eval_runtime": 686.5544,
	"eval_samples_per_second": 4.174,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1.0000000000000002e-07,
	"step": 30414
	},
	{
	"epoch": 111.31,
	"learning_rate": 1.0000000000000002e-07,
	"loss": 0.0851,
	"step": 30500
	},
	{
	"epoch": 112.0,
	"eval_accuracy": 0.5631542219120725,
	"eval_f1_macro": 0.7575801018117111,
	"eval_f1_micro": 0.8580721134974485,
	"eval_loss": 0.08170080929994583,
	"eval_roc_auc": 0.91075603440298,
	"eval_runtime": 746.778,
	"eval_samples_per_second": 3.838,
	"eval_steps_per_second": 0.121,
	"learning_rate": 1.0000000000000002e-07,
	"step": 30688
	},
	{
	"epoch": 113.0,
	"eval_accuracy": 0.5614096301465457,
	"eval_f1_macro": 0.7562692232145891,
	"eval_f1_micro": 0.8583059164668487,
	"eval_loss": 0.081505186855793,
	"eval_roc_auc": 0.912813663063945,
	"eval_runtime": 687.4479,
	"eval_samples_per_second": 4.169,
	"eval_steps_per_second": 0.131,
	"learning_rate": 1.0000000000000002e-07,
	"step": 30962
	},
	{
	"epoch": 113.14,
	"learning_rate": 1.0000000000000002e-07,
	"loss": 0.0848,
	"step": 31000
	},
	{
	"epoch": 114.0,
	"eval_accuracy": 0.5655966503838102,
	"eval_f1_macro": 0.7560403631861836,
	"eval_f1_micro": 0.8563654914408797,
	"eval_loss": 0.08186182379722595,
	"eval_roc_auc": 0.9061407756963643,
	"eval_runtime": 731.2304,
	"eval_samples_per_second": 3.919,
	"eval_steps_per_second": 0.123,
	"learning_rate": 1.0000000000000002e-07,
	"step": 31236
	},
	{
	"epoch": 114.0,
	"learning_rate": 1.0000000000000002e-07,
	"step": 31236,
	"total_flos": 1.4819663325231928e+21,
	"train_loss": 0.033337813025782426,
	"train_runtime": 131818.0427,
	"train_samples_per_second": 9.311,
	"train_steps_per_second": 0.291
	}
	],
	"logging_steps": 500,
	"max_steps": 38360,
	"num_train_epochs": 140,
	"save_steps": 500,
	"total_flos": 1.4819663325231928e+21,
	"trial_name": null,
	"trial_params": null
	}