card_type_image_detection / checkpoint-12573 /trainer_state.json

Upload folder using huggingface_hub

501530f 11 months ago

27.8 kB

	{
	"best_metric": 2.2068374156951904,
	"best_model_checkpoint": "card_type_image_detection/checkpoint-12573",
	"epoch": 99.0,
	"eval_steps": 500,
	"global_step": 12573,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 1.0,
	"eval_accuracy": 0.023209876543209877,
	"eval_loss": 3.959347724914551,
	"eval_runtime": 16.3056,
	"eval_samples_per_second": 124.191,
	"eval_steps_per_second": 3.925,
	"step": 127
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.047407407407407405,
	"eval_loss": 3.927157163619995,
	"eval_runtime": 16.3398,
	"eval_samples_per_second": 123.93,
	"eval_steps_per_second": 3.917,
	"step": 254
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.0819753086419753,
	"eval_loss": 3.8877668380737305,
	"eval_runtime": 16.2853,
	"eval_samples_per_second": 124.345,
	"eval_steps_per_second": 3.93,
	"step": 381
	},
	{
	"epoch": 3.94,
	"learning_rate": 1.9288537549407114e-06,
	"loss": 3.9022,
	"step": 500
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.09876543209876543,
	"eval_loss": 3.8418056964874268,
	"eval_runtime": 16.2864,
	"eval_samples_per_second": 124.337,
	"eval_steps_per_second": 3.93,
	"step": 508
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.12,
	"eval_loss": 3.7911477088928223,
	"eval_runtime": 16.2971,
	"eval_samples_per_second": 124.255,
	"eval_steps_per_second": 3.927,
	"step": 635
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.1382716049382716,
	"eval_loss": 3.7379021644592285,
	"eval_runtime": 16.4902,
	"eval_samples_per_second": 122.8,
	"eval_steps_per_second": 3.881,
	"step": 762
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.1580246913580247,
	"eval_loss": 3.6840596199035645,
	"eval_runtime": 16.2622,
	"eval_samples_per_second": 124.522,
	"eval_steps_per_second": 3.936,
	"step": 889
	},
	{
	"epoch": 7.87,
	"learning_rate": 1.849802371541502e-06,
	"loss": 3.6821,
	"step": 1000
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.17777777777777778,
	"eval_loss": 3.6320221424102783,
	"eval_runtime": 16.3988,
	"eval_samples_per_second": 123.485,
	"eval_steps_per_second": 3.903,
	"step": 1016
	},
	{
	"epoch": 9.0,
	"eval_accuracy": 0.19654320987654322,
	"eval_loss": 3.580777883529663,
	"eval_runtime": 16.325,
	"eval_samples_per_second": 124.043,
	"eval_steps_per_second": 3.92,
	"step": 1143
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.21580246913580248,
	"eval_loss": 3.5295674800872803,
	"eval_runtime": 16.3625,
	"eval_samples_per_second": 123.758,
	"eval_steps_per_second": 3.911,
	"step": 1270
	},
	{
	"epoch": 11.0,
	"eval_accuracy": 0.23703703703703705,
	"eval_loss": 3.479665994644165,
	"eval_runtime": 16.5252,
	"eval_samples_per_second": 122.54,
	"eval_steps_per_second": 3.873,
	"step": 1397
	},
	{
	"epoch": 11.81,
	"learning_rate": 1.7707509881422924e-06,
	"loss": 3.4599,
	"step": 1500
	},
	{
	"epoch": 12.0,
	"eval_accuracy": 0.24592592592592594,
	"eval_loss": 3.431598663330078,
	"eval_runtime": 16.3048,
	"eval_samples_per_second": 124.197,
	"eval_steps_per_second": 3.925,
	"step": 1524
	},
	{
	"epoch": 13.0,
	"eval_accuracy": 0.25728395061728393,
	"eval_loss": 3.38520884513855,
	"eval_runtime": 16.3716,
	"eval_samples_per_second": 123.69,
	"eval_steps_per_second": 3.909,
	"step": 1651
	},
	{
	"epoch": 14.0,
	"eval_accuracy": 0.2730864197530864,
	"eval_loss": 3.341092348098755,
	"eval_runtime": 16.4208,
	"eval_samples_per_second": 123.319,
	"eval_steps_per_second": 3.897,
	"step": 1778
	},
	{
	"epoch": 15.0,
	"eval_accuracy": 0.291358024691358,
	"eval_loss": 3.299830198287964,
	"eval_runtime": 16.349,
	"eval_samples_per_second": 123.861,
	"eval_steps_per_second": 3.915,
	"step": 1905
	},
	{
	"epoch": 15.75,
	"learning_rate": 1.691699604743083e-06,
	"loss": 3.2748,
	"step": 2000
	},
	{
	"epoch": 16.0,
	"eval_accuracy": 0.305679012345679,
	"eval_loss": 3.2592811584472656,
	"eval_runtime": 16.2664,
	"eval_samples_per_second": 124.49,
	"eval_steps_per_second": 3.934,
	"step": 2032
	},
	{
	"epoch": 17.0,
	"eval_accuracy": 0.32641975308641974,
	"eval_loss": 3.2209341526031494,
	"eval_runtime": 16.4355,
	"eval_samples_per_second": 123.209,
	"eval_steps_per_second": 3.894,
	"step": 2159
	},
	{
	"epoch": 18.0,
	"eval_accuracy": 0.3437037037037037,
	"eval_loss": 3.184448003768921,
	"eval_runtime": 16.3387,
	"eval_samples_per_second": 123.939,
	"eval_steps_per_second": 3.917,
	"step": 2286
	},
	{
	"epoch": 19.0,
	"eval_accuracy": 0.345679012345679,
	"eval_loss": 3.1492130756378174,
	"eval_runtime": 16.2457,
	"eval_samples_per_second": 124.648,
	"eval_steps_per_second": 3.939,
	"step": 2413
	},
	{
	"epoch": 19.69,
	"learning_rate": 1.6126482213438735e-06,
	"loss": 3.1183,
	"step": 2500
	},
	{
	"epoch": 20.0,
	"eval_accuracy": 0.3634567901234568,
	"eval_loss": 3.117238998413086,
	"eval_runtime": 16.3142,
	"eval_samples_per_second": 124.125,
	"eval_steps_per_second": 3.923,
	"step": 2540
	},
	{
	"epoch": 21.0,
	"eval_accuracy": 0.37382716049382714,
	"eval_loss": 3.0856010913848877,
	"eval_runtime": 16.4136,
	"eval_samples_per_second": 123.374,
	"eval_steps_per_second": 3.899,
	"step": 2667
	},
	{
	"epoch": 22.0,
	"eval_accuracy": 0.38469135802469134,
	"eval_loss": 3.0540201663970947,
	"eval_runtime": 16.404,
	"eval_samples_per_second": 123.446,
	"eval_steps_per_second": 3.901,
	"step": 2794
	},
	{
	"epoch": 23.0,
	"eval_accuracy": 0.3916049382716049,
	"eval_loss": 3.025864362716675,
	"eval_runtime": 16.3387,
	"eval_samples_per_second": 123.939,
	"eval_steps_per_second": 3.917,
	"step": 2921
	},
	{
	"epoch": 23.62,
	"learning_rate": 1.533596837944664e-06,
	"loss": 2.9883,
	"step": 3000
	},
	{
	"epoch": 24.0,
	"eval_accuracy": 0.4014814814814815,
	"eval_loss": 2.9977123737335205,
	"eval_runtime": 16.5183,
	"eval_samples_per_second": 122.592,
	"eval_steps_per_second": 3.874,
	"step": 3048
	},
	{
	"epoch": 25.0,
	"eval_accuracy": 0.4103703703703704,
	"eval_loss": 2.970736503601074,
	"eval_runtime": 16.4478,
	"eval_samples_per_second": 123.117,
	"eval_steps_per_second": 3.891,
	"step": 3175
	},
	{
	"epoch": 26.0,
	"eval_accuracy": 0.42962962962962964,
	"eval_loss": 2.9437484741210938,
	"eval_runtime": 16.3805,
	"eval_samples_per_second": 123.623,
	"eval_steps_per_second": 3.907,
	"step": 3302
	},
	{
	"epoch": 27.0,
	"eval_accuracy": 0.4365432098765432,
	"eval_loss": 2.918938636779785,
	"eval_runtime": 16.4584,
	"eval_samples_per_second": 123.038,
	"eval_steps_per_second": 3.889,
	"step": 3429
	},
	{
	"epoch": 27.56,
	"learning_rate": 1.4545454545454544e-06,
	"loss": 2.8743,
	"step": 3500
	},
	{
	"epoch": 28.0,
	"eval_accuracy": 0.44592592592592595,
	"eval_loss": 2.8959240913391113,
	"eval_runtime": 16.8148,
	"eval_samples_per_second": 120.43,
	"eval_steps_per_second": 3.806,
	"step": 3556
	},
	{
	"epoch": 29.0,
	"eval_accuracy": 0.4597530864197531,
	"eval_loss": 2.8701860904693604,
	"eval_runtime": 16.5161,
	"eval_samples_per_second": 122.607,
	"eval_steps_per_second": 3.875,
	"step": 3683
	},
	{
	"epoch": 30.0,
	"eval_accuracy": 0.46469135802469136,
	"eval_loss": 2.848033905029297,
	"eval_runtime": 16.6005,
	"eval_samples_per_second": 121.984,
	"eval_steps_per_second": 3.855,
	"step": 3810
	},
	{
	"epoch": 31.0,
	"eval_accuracy": 0.4730864197530864,
	"eval_loss": 2.825526714324951,
	"eval_runtime": 16.5596,
	"eval_samples_per_second": 122.286,
	"eval_steps_per_second": 3.865,
	"step": 3937
	},
	{
	"epoch": 31.5,
	"learning_rate": 1.375494071146245e-06,
	"loss": 2.773,
	"step": 4000
	},
	{
	"epoch": 32.0,
	"eval_accuracy": 0.47802469135802467,
	"eval_loss": 2.804414749145508,
	"eval_runtime": 16.6816,
	"eval_samples_per_second": 121.391,
	"eval_steps_per_second": 3.837,
	"step": 4064
	},
	{
	"epoch": 33.0,
	"eval_accuracy": 0.47555555555555556,
	"eval_loss": 2.7853612899780273,
	"eval_runtime": 16.7524,
	"eval_samples_per_second": 120.878,
	"eval_steps_per_second": 3.82,
	"step": 4191
	},
	{
	"epoch": 34.0,
	"eval_accuracy": 0.4918518518518519,
	"eval_loss": 2.7612335681915283,
	"eval_runtime": 16.5289,
	"eval_samples_per_second": 122.513,
	"eval_steps_per_second": 3.872,
	"step": 4318
	},
	{
	"epoch": 35.0,
	"eval_accuracy": 0.497283950617284,
	"eval_loss": 2.741335391998291,
	"eval_runtime": 16.6912,
	"eval_samples_per_second": 121.321,
	"eval_steps_per_second": 3.834,
	"step": 4445
	},
	{
	"epoch": 35.43,
	"learning_rate": 1.2964426877470356e-06,
	"loss": 2.6822,
	"step": 4500
	},
	{
	"epoch": 36.0,
	"eval_accuracy": 0.49876543209876545,
	"eval_loss": 2.724756956100464,
	"eval_runtime": 16.517,
	"eval_samples_per_second": 122.601,
	"eval_steps_per_second": 3.875,
	"step": 4572
	},
	{
	"epoch": 37.0,
	"eval_accuracy": 0.49777777777777776,
	"eval_loss": 2.7084524631500244,
	"eval_runtime": 16.6709,
	"eval_samples_per_second": 121.469,
	"eval_steps_per_second": 3.839,
	"step": 4699
	},
	{
	"epoch": 38.0,
	"eval_accuracy": 0.5150617283950617,
	"eval_loss": 2.6876704692840576,
	"eval_runtime": 16.6152,
	"eval_samples_per_second": 121.876,
	"eval_steps_per_second": 3.852,
	"step": 4826
	},
	{
	"epoch": 39.0,
	"eval_accuracy": 0.5106172839506172,
	"eval_loss": 2.6705734729766846,
	"eval_runtime": 16.5075,
	"eval_samples_per_second": 122.671,
	"eval_steps_per_second": 3.877,
	"step": 4953
	},
	{
	"epoch": 39.37,
	"learning_rate": 1.217391304347826e-06,
	"loss": 2.5988,
	"step": 5000
	},
	{
	"epoch": 40.0,
	"eval_accuracy": 0.5116049382716049,
	"eval_loss": 2.655836343765259,
	"eval_runtime": 16.7707,
	"eval_samples_per_second": 120.746,
	"eval_steps_per_second": 3.816,
	"step": 5080
	},
	{
	"epoch": 41.0,
	"eval_accuracy": 0.5125925925925926,
	"eval_loss": 2.6394340991973877,
	"eval_runtime": 16.7747,
	"eval_samples_per_second": 120.718,
	"eval_steps_per_second": 3.815,
	"step": 5207
	},
	{
	"epoch": 42.0,
	"eval_accuracy": 0.5209876543209877,
	"eval_loss": 2.623532295227051,
	"eval_runtime": 16.7009,
	"eval_samples_per_second": 121.251,
	"eval_steps_per_second": 3.832,
	"step": 5334
	},
	{
	"epoch": 43.0,
	"eval_accuracy": 0.5249382716049382,
	"eval_loss": 2.6078622341156006,
	"eval_runtime": 16.3629,
	"eval_samples_per_second": 123.756,
	"eval_steps_per_second": 3.911,
	"step": 5461
	},
	{
	"epoch": 43.31,
	"learning_rate": 1.1383399209486167e-06,
	"loss": 2.5306,
	"step": 5500
	},
	{
	"epoch": 44.0,
	"eval_accuracy": 0.5293827160493827,
	"eval_loss": 2.592928647994995,
	"eval_runtime": 16.7766,
	"eval_samples_per_second": 120.704,
	"eval_steps_per_second": 3.815,
	"step": 5588
	},
	{
	"epoch": 45.0,
	"eval_accuracy": 0.5338271604938272,
	"eval_loss": 2.575329542160034,
	"eval_runtime": 17.0334,
	"eval_samples_per_second": 118.884,
	"eval_steps_per_second": 3.757,
	"step": 5715
	},
	{
	"epoch": 46.0,
	"eval_accuracy": 0.542716049382716,
	"eval_loss": 2.5605058670043945,
	"eval_runtime": 16.7153,
	"eval_samples_per_second": 121.146,
	"eval_steps_per_second": 3.829,
	"step": 5842
	},
	{
	"epoch": 47.0,
	"eval_accuracy": 0.548641975308642,
	"eval_loss": 2.548151969909668,
	"eval_runtime": 16.3632,
	"eval_samples_per_second": 123.754,
	"eval_steps_per_second": 3.911,
	"step": 5969
	},
	{
	"epoch": 47.24,
	"learning_rate": 1.0592885375494072e-06,
	"loss": 2.4638,
	"step": 6000
	},
	{
	"epoch": 48.0,
	"eval_accuracy": 0.5530864197530864,
	"eval_loss": 2.5332412719726562,
	"eval_runtime": 16.2257,
	"eval_samples_per_second": 124.802,
	"eval_steps_per_second": 3.944,
	"step": 6096
	},
	{
	"epoch": 49.0,
	"eval_accuracy": 0.5535802469135802,
	"eval_loss": 2.521514654159546,
	"eval_runtime": 16.2855,
	"eval_samples_per_second": 124.344,
	"eval_steps_per_second": 3.93,
	"step": 6223
	},
	{
	"epoch": 50.0,
	"eval_accuracy": 0.5619753086419753,
	"eval_loss": 2.507723569869995,
	"eval_runtime": 16.2945,
	"eval_samples_per_second": 124.275,
	"eval_steps_per_second": 3.928,
	"step": 6350
	},
	{
	"epoch": 51.0,
	"eval_accuracy": 0.5595061728395062,
	"eval_loss": 2.4946696758270264,
	"eval_runtime": 16.2486,
	"eval_samples_per_second": 124.626,
	"eval_steps_per_second": 3.939,
	"step": 6477
	},
	{
	"epoch": 51.18,
	"learning_rate": 9.802371541501976e-07,
	"loss": 2.405,
	"step": 6500
	},
	{
	"epoch": 52.0,
	"eval_accuracy": 0.5580246913580247,
	"eval_loss": 2.4835174083709717,
	"eval_runtime": 16.5375,
	"eval_samples_per_second": 122.449,
	"eval_steps_per_second": 3.87,
	"step": 6604
	},
	{
	"epoch": 53.0,
	"eval_accuracy": 0.5585185185185185,
	"eval_loss": 2.473555088043213,
	"eval_runtime": 17.2437,
	"eval_samples_per_second": 117.434,
	"eval_steps_per_second": 3.711,
	"step": 6731
	},
	{
	"epoch": 54.0,
	"eval_accuracy": 0.5644444444444444,
	"eval_loss": 2.4599006175994873,
	"eval_runtime": 17.2017,
	"eval_samples_per_second": 117.721,
	"eval_steps_per_second": 3.721,
	"step": 6858
	},
	{
	"epoch": 55.0,
	"eval_accuracy": 0.5708641975308641,
	"eval_loss": 2.444490432739258,
	"eval_runtime": 16.4767,
	"eval_samples_per_second": 122.901,
	"eval_steps_per_second": 3.884,
	"step": 6985
	},
	{
	"epoch": 55.12,
	"learning_rate": 9.011857707509881e-07,
	"loss": 2.3499,
	"step": 7000
	},
	{
	"epoch": 56.0,
	"eval_accuracy": 0.5718518518518518,
	"eval_loss": 2.43546199798584,
	"eval_runtime": 17.1098,
	"eval_samples_per_second": 118.353,
	"eval_steps_per_second": 3.741,
	"step": 7112
	},
	{
	"epoch": 57.0,
	"eval_accuracy": 0.5738271604938272,
	"eval_loss": 2.424128532409668,
	"eval_runtime": 16.3356,
	"eval_samples_per_second": 123.962,
	"eval_steps_per_second": 3.918,
	"step": 7239
	},
	{
	"epoch": 58.0,
	"eval_accuracy": 0.5679012345679012,
	"eval_loss": 2.4162774085998535,
	"eval_runtime": 16.3093,
	"eval_samples_per_second": 124.162,
	"eval_steps_per_second": 3.924,
	"step": 7366
	},
	{
	"epoch": 59.0,
	"eval_accuracy": 0.5733333333333334,
	"eval_loss": 2.404547929763794,
	"eval_runtime": 16.3838,
	"eval_samples_per_second": 123.598,
	"eval_steps_per_second": 3.906,
	"step": 7493
	},
	{
	"epoch": 59.06,
	"learning_rate": 8.221343873517787e-07,
	"loss": 2.3047,
	"step": 7500
	},
	{
	"epoch": 60.0,
	"eval_accuracy": 0.5767901234567901,
	"eval_loss": 2.3955578804016113,
	"eval_runtime": 16.4961,
	"eval_samples_per_second": 122.756,
	"eval_steps_per_second": 3.88,
	"step": 7620
	},
	{
	"epoch": 61.0,
	"eval_accuracy": 0.5733333333333334,
	"eval_loss": 2.3882274627685547,
	"eval_runtime": 16.5941,
	"eval_samples_per_second": 122.031,
	"eval_steps_per_second": 3.857,
	"step": 7747
	},
	{
	"epoch": 62.0,
	"eval_accuracy": 0.5758024691358025,
	"eval_loss": 2.3768720626831055,
	"eval_runtime": 16.3063,
	"eval_samples_per_second": 124.185,
	"eval_steps_per_second": 3.925,
	"step": 7874
	},
	{
	"epoch": 62.99,
	"learning_rate": 7.430830039525692e-07,
	"loss": 2.2616,
	"step": 8000
	},
	{
	"epoch": 63.0,
	"eval_accuracy": 0.5802469135802469,
	"eval_loss": 2.3649182319641113,
	"eval_runtime": 16.4383,
	"eval_samples_per_second": 123.188,
	"eval_steps_per_second": 3.893,
	"step": 8001
	},
	{
	"epoch": 64.0,
	"eval_accuracy": 0.5782716049382716,
	"eval_loss": 2.3605239391326904,
	"eval_runtime": 16.5048,
	"eval_samples_per_second": 122.691,
	"eval_steps_per_second": 3.878,
	"step": 8128
	},
	{
	"epoch": 65.0,
	"eval_accuracy": 0.5881481481481482,
	"eval_loss": 2.348599433898926,
	"eval_runtime": 16.6986,
	"eval_samples_per_second": 121.268,
	"eval_steps_per_second": 3.833,
	"step": 8255
	},
	{
	"epoch": 66.0,
	"eval_accuracy": 0.5891358024691358,
	"eval_loss": 2.3403825759887695,
	"eval_runtime": 16.6528,
	"eval_samples_per_second": 121.601,
	"eval_steps_per_second": 3.843,
	"step": 8382
	},
	{
	"epoch": 66.93,
	"learning_rate": 6.640316205533597e-07,
	"loss": 2.224,
	"step": 8500
	},
	{
	"epoch": 67.0,
	"eval_accuracy": 0.5876543209876544,
	"eval_loss": 2.333630323410034,
	"eval_runtime": 16.323,
	"eval_samples_per_second": 124.058,
	"eval_steps_per_second": 3.921,
	"step": 8509
	},
	{
	"epoch": 68.0,
	"eval_accuracy": 0.5881481481481482,
	"eval_loss": 2.3267500400543213,
	"eval_runtime": 16.3769,
	"eval_samples_per_second": 123.649,
	"eval_steps_per_second": 3.908,
	"step": 8636
	},
	{
	"epoch": 69.0,
	"eval_accuracy": 0.5871604938271605,
	"eval_loss": 2.3214409351348877,
	"eval_runtime": 16.4152,
	"eval_samples_per_second": 123.361,
	"eval_steps_per_second": 3.899,
	"step": 8763
	},
	{
	"epoch": 70.0,
	"eval_accuracy": 0.5920987654320987,
	"eval_loss": 2.3111300468444824,
	"eval_runtime": 16.7406,
	"eval_samples_per_second": 120.963,
	"eval_steps_per_second": 3.823,
	"step": 8890
	},
	{
	"epoch": 70.87,
	"learning_rate": 5.849802371541502e-07,
	"loss": 2.1885,
	"step": 9000
	},
	{
	"epoch": 71.0,
	"eval_accuracy": 0.5906172839506173,
	"eval_loss": 2.304325580596924,
	"eval_runtime": 16.5534,
	"eval_samples_per_second": 122.331,
	"eval_steps_per_second": 3.866,
	"step": 9017
	},
	{
	"epoch": 72.0,
	"eval_accuracy": 0.5960493827160493,
	"eval_loss": 2.297461986541748,
	"eval_runtime": 16.4435,
	"eval_samples_per_second": 123.149,
	"eval_steps_per_second": 3.892,
	"step": 9144
	},
	{
	"epoch": 73.0,
	"eval_accuracy": 0.5871604938271605,
	"eval_loss": 2.296058177947998,
	"eval_runtime": 16.3403,
	"eval_samples_per_second": 123.927,
	"eval_steps_per_second": 3.917,
	"step": 9271
	},
	{
	"epoch": 74.0,
	"eval_accuracy": 0.5960493827160493,
	"eval_loss": 2.2856781482696533,
	"eval_runtime": 16.6488,
	"eval_samples_per_second": 121.63,
	"eval_steps_per_second": 3.844,
	"step": 9398
	},
	{
	"epoch": 74.8,
	"learning_rate": 5.059288537549406e-07,
	"loss": 2.1603,
	"step": 9500
	},
	{
	"epoch": 75.0,
	"eval_accuracy": 0.5965432098765432,
	"eval_loss": 2.2791759967803955,
	"eval_runtime": 17.0015,
	"eval_samples_per_second": 119.107,
	"eval_steps_per_second": 3.764,
	"step": 9525
	},
	{
	"epoch": 76.0,
	"eval_accuracy": 0.5955555555555555,
	"eval_loss": 2.2750935554504395,
	"eval_runtime": 16.6586,
	"eval_samples_per_second": 121.559,
	"eval_steps_per_second": 3.842,
	"step": 9652
	},
	{
	"epoch": 77.0,
	"eval_accuracy": 0.5965432098765432,
	"eval_loss": 2.268305540084839,
	"eval_runtime": 16.6007,
	"eval_samples_per_second": 121.983,
	"eval_steps_per_second": 3.855,
	"step": 9779
	},
	{
	"epoch": 78.0,
	"eval_accuracy": 0.6049382716049383,
	"eval_loss": 2.2604947090148926,
	"eval_runtime": 16.3684,
	"eval_samples_per_second": 123.714,
	"eval_steps_per_second": 3.91,
	"step": 9906
	},
	{
	"epoch": 78.74,
	"learning_rate": 4.268774703557312e-07,
	"loss": 2.1357,
	"step": 10000
	},
	{
	"epoch": 79.0,
	"eval_accuracy": 0.6064197530864197,
	"eval_loss": 2.254981756210327,
	"eval_runtime": 16.4537,
	"eval_samples_per_second": 123.072,
	"eval_steps_per_second": 3.89,
	"step": 10033
	},
	{
	"epoch": 80.0,
	"eval_accuracy": 0.6034567901234568,
	"eval_loss": 2.2524936199188232,
	"eval_runtime": 16.3798,
	"eval_samples_per_second": 123.628,
	"eval_steps_per_second": 3.907,
	"step": 10160
	},
	{
	"epoch": 81.0,
	"eval_accuracy": 0.6054320987654321,
	"eval_loss": 2.2475554943084717,
	"eval_runtime": 16.2339,
	"eval_samples_per_second": 124.739,
	"eval_steps_per_second": 3.942,
	"step": 10287
	},
	{
	"epoch": 82.0,
	"eval_accuracy": 0.6004938271604938,
	"eval_loss": 2.244779586791992,
	"eval_runtime": 16.19,
	"eval_samples_per_second": 125.077,
	"eval_steps_per_second": 3.953,
	"step": 10414
	},
	{
	"epoch": 82.68,
	"learning_rate": 3.478260869565217e-07,
	"loss": 2.1153,
	"step": 10500
	},
	{
	"epoch": 83.0,
	"eval_accuracy": 0.6009876543209877,
	"eval_loss": 2.242079973220825,
	"eval_runtime": 16.2447,
	"eval_samples_per_second": 124.656,
	"eval_steps_per_second": 3.94,
	"step": 10541
	},
	{
	"epoch": 84.0,
	"eval_accuracy": 0.6009876543209877,
	"eval_loss": 2.237128973007202,
	"eval_runtime": 16.3552,
	"eval_samples_per_second": 123.814,
	"eval_steps_per_second": 3.913,
	"step": 10668
	},
	{
	"epoch": 85.0,
	"eval_accuracy": 0.6034567901234568,
	"eval_loss": 2.2331736087799072,
	"eval_runtime": 16.4131,
	"eval_samples_per_second": 123.377,
	"eval_steps_per_second": 3.899,
	"step": 10795
	},
	{
	"epoch": 86.0,
	"eval_accuracy": 0.6064197530864197,
	"eval_loss": 2.230192184448242,
	"eval_runtime": 16.263,
	"eval_samples_per_second": 124.516,
	"eval_steps_per_second": 3.935,
	"step": 10922
	},
	{
	"epoch": 86.61,
	"learning_rate": 2.6877470355731227e-07,
	"loss": 2.0969,
	"step": 11000
	},
	{
	"epoch": 87.0,
	"eval_accuracy": 0.6083950617283951,
	"eval_loss": 2.2269179821014404,
	"eval_runtime": 16.4471,
	"eval_samples_per_second": 123.122,
	"eval_steps_per_second": 3.891,
	"step": 11049
	},
	{
	"epoch": 88.0,
	"eval_accuracy": 0.6054320987654321,
	"eval_loss": 2.224729537963867,
	"eval_runtime": 16.5547,
	"eval_samples_per_second": 122.322,
	"eval_steps_per_second": 3.866,
	"step": 11176
	},
	{
	"epoch": 89.0,
	"eval_accuracy": 0.6098765432098765,
	"eval_loss": 2.2210581302642822,
	"eval_runtime": 16.3636,
	"eval_samples_per_second": 123.75,
	"eval_steps_per_second": 3.911,
	"step": 11303
	},
	{
	"epoch": 90.0,
	"eval_accuracy": 0.6049382716049383,
	"eval_loss": 2.2199292182922363,
	"eval_runtime": 16.5723,
	"eval_samples_per_second": 122.192,
	"eval_steps_per_second": 3.862,
	"step": 11430
	},
	{
	"epoch": 90.55,
	"learning_rate": 1.8972332015810276e-07,
	"loss": 2.0851,
	"step": 11500
	},
	{
	"epoch": 91.0,
	"eval_accuracy": 0.6103703703703703,
	"eval_loss": 2.2158267498016357,
	"eval_runtime": 16.2141,
	"eval_samples_per_second": 124.892,
	"eval_steps_per_second": 3.947,
	"step": 11557
	},
	{
	"epoch": 92.0,
	"eval_accuracy": 0.6079012345679012,
	"eval_loss": 2.214700937271118,
	"eval_runtime": 16.2859,
	"eval_samples_per_second": 124.341,
	"eval_steps_per_second": 3.93,
	"step": 11684
	},
	{
	"epoch": 93.0,
	"eval_accuracy": 0.6064197530864197,
	"eval_loss": 2.2131123542785645,
	"eval_runtime": 16.337,
	"eval_samples_per_second": 123.952,
	"eval_steps_per_second": 3.917,
	"step": 11811
	},
	{
	"epoch": 94.0,
	"eval_accuracy": 0.6098765432098765,
	"eval_loss": 2.2114579677581787,
	"eval_runtime": 16.393,
	"eval_samples_per_second": 123.528,
	"eval_steps_per_second": 3.904,
	"step": 11938
	},
	{
	"epoch": 94.49,
	"learning_rate": 1.1067193675889327e-07,
	"loss": 2.0754,
	"step": 12000
	},
	{
	"epoch": 95.0,
	"eval_accuracy": 0.6138271604938271,
	"eval_loss": 2.209113597869873,
	"eval_runtime": 16.4652,
	"eval_samples_per_second": 122.987,
	"eval_steps_per_second": 3.887,
	"step": 12065
	},
	{
	"epoch": 96.0,
	"eval_accuracy": 0.6128395061728396,
	"eval_loss": 2.2085654735565186,
	"eval_runtime": 16.3862,
	"eval_samples_per_second": 123.579,
	"eval_steps_per_second": 3.906,
	"step": 12192
	},
	{
	"epoch": 97.0,
	"eval_accuracy": 0.6123456790123457,
	"eval_loss": 2.207934617996216,
	"eval_runtime": 16.3381,
	"eval_samples_per_second": 123.943,
	"eval_steps_per_second": 3.917,
	"step": 12319
	},
	{
	"epoch": 98.0,
	"eval_accuracy": 0.6128395061728396,
	"eval_loss": 2.206979513168335,
	"eval_runtime": 16.3485,
	"eval_samples_per_second": 123.865,
	"eval_steps_per_second": 3.915,
	"step": 12446
	},
	{
	"epoch": 98.43,
	"learning_rate": 3.162055335968379e-08,
	"loss": 2.0667,
	"step": 12500
	},
	{
	"epoch": 99.0,
	"eval_accuracy": 0.6133333333333333,
	"eval_loss": 2.2068374156951904,
	"eval_runtime": 16.2194,
	"eval_samples_per_second": 124.851,
	"eval_steps_per_second": 3.946,
	"step": 12573
	}
	],
	"logging_steps": 500,
	"max_steps": 12700,
	"num_train_epochs": 100,
	"save_steps": 500,
	"total_flos": 6.215388042176161e+19,
	"trial_name": null,
	"trial_params": null
	}