End of training

Browse files

Files changed (4) hide show

all_results.json +17 -0
eval_results.json +12 -0
train_results.json +8 -0
trainer_state.json +1105 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+    "epoch": 10.0,
+    "eval_accuracy": 0.9925820645613489,
+    "eval_f1": 0.9571847507331379,
+    "eval_loss": 0.04227477312088013,
+    "eval_precision": 0.953111963957951,
+    "eval_recall": 0.9612924941097274,
+    "eval_runtime": 6.2758,
+    "eval_samples": 3251,
+    "eval_samples_per_second": 518.019,
+    "eval_steps_per_second": 0.637,
+    "train_loss": 0.021953743980689482,
+    "train_runtime": 1347.1839,
+    "train_samples": 14042,
+    "train_samples_per_second": 104.232,
+    "train_steps_per_second": 1.633
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 10.0,
+    "eval_accuracy": 0.9925820645613489,
+    "eval_f1": 0.9571847507331379,
+    "eval_loss": 0.04227477312088013,
+    "eval_precision": 0.953111963957951,
+    "eval_recall": 0.9612924941097274,
+    "eval_runtime": 6.2758,
+    "eval_samples": 3251,
+    "eval_samples_per_second": 518.019,
+    "eval_steps_per_second": 0.637
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 10.0,
+    "train_loss": 0.021953743980689482,
+    "train_runtime": 1347.1839,
+    "train_samples": 14042,
+    "train_samples_per_second": 104.232,
+    "train_steps_per_second": 1.633
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1105 @@

+{
+  "best_metric": 0.9571847507331379,
+  "best_model_checkpoint": "twitter-roberta-base-CoNLL/checkpoint-2000",
+  "epoch": 10.0,
+  "global_step": 2200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.11,
+      "eval_accuracy": 0.9385927339278065,
+      "eval_f1": 0.6587314799400699,
+      "eval_loss": 0.2062799483537674,
+      "eval_precision": 0.6516798418972332,
+      "eval_recall": 0.6659373948165601,
+      "eval_runtime": 5.9743,
+      "eval_samples_per_second": 544.169,
+      "eval_steps_per_second": 0.67,
+      "step": 25
+    },
+    {
+      "epoch": 0.23,
+      "eval_accuracy": 0.9771231649857871,
+      "eval_f1": 0.8565321055660609,
+      "eval_loss": 0.08096875995397568,
+      "eval_precision": 0.8373251888763864,
+      "eval_recall": 0.8766408616627398,
+      "eval_runtime": 6.1826,
+      "eval_samples_per_second": 525.833,
+      "eval_steps_per_second": 0.647,
+      "step": 50
+    },
+    {
+      "epoch": 0.34,
+      "eval_accuracy": 0.9826914839764807,
+      "eval_f1": 0.8996990972918756,
+      "eval_loss": 0.06511491537094116,
+      "eval_precision": 0.8937230156094321,
+      "eval_recall": 0.9057556378323797,
+      "eval_runtime": 6.0199,
+      "eval_samples_per_second": 540.041,
+      "eval_steps_per_second": 0.664,
+      "step": 75
+    },
+    {
+      "epoch": 0.45,
+      "eval_accuracy": 0.9849110237140298,
+      "eval_f1": 0.907388833166165,
+      "eval_loss": 0.05366199463605881,
+      "eval_precision": 0.9013616738625041,
+      "eval_recall": 0.9134971390104342,
+      "eval_runtime": 6.2998,
+      "eval_samples_per_second": 516.048,
+      "eval_steps_per_second": 0.635,
+      "step": 100
+    },
+    {
+      "epoch": 0.57,
+      "eval_accuracy": 0.986682761574705,
+      "eval_f1": 0.9170283806343906,
+      "eval_loss": 0.04637985676527023,
+      "eval_precision": 0.9097383239483272,
+      "eval_recall": 0.924436216762033,
+      "eval_runtime": 6.0114,
+      "eval_samples_per_second": 540.803,
+      "eval_steps_per_second": 0.665,
+      "step": 125
+    },
+    {
+      "epoch": 0.68,
+      "eval_accuracy": 0.9884544994353802,
+      "eval_f1": 0.9296410942859533,
+      "eval_loss": 0.042301442474126816,
+      "eval_precision": 0.9243054400266179,
+      "eval_recall": 0.9350387075058902,
+      "eval_runtime": 6.0918,
+      "eval_samples_per_second": 533.67,
+      "eval_steps_per_second": 0.657,
+      "step": 150
+    },
+    {
+      "epoch": 0.8,
+      "eval_accuracy": 0.9899731318873876,
+      "eval_f1": 0.934277384423157,
+      "eval_loss": 0.038059305399656296,
+      "eval_precision": 0.9249546429160481,
+      "eval_recall": 0.9437899697071693,
+      "eval_runtime": 6.2554,
+      "eval_samples_per_second": 519.713,
+      "eval_steps_per_second": 0.639,
+      "step": 175
+    },
+    {
+      "epoch": 0.91,
+      "eval_accuracy": 0.9895642693041549,
+      "eval_f1": 0.9354220481626531,
+      "eval_loss": 0.038840554654598236,
+      "eval_precision": 0.9263904934807724,
+      "eval_recall": 0.9446314372265231,
+      "eval_runtime": 6.0921,
+      "eval_samples_per_second": 533.639,
+      "eval_steps_per_second": 0.657,
+      "step": 200
+    },
+    {
+      "epoch": 1.02,
+      "eval_accuracy": 0.9898368443596434,
+      "eval_f1": 0.9384409501505521,
+      "eval_loss": 0.03943933546543121,
+      "eval_precision": 0.9328234120385767,
+      "eval_recall": 0.9441265567149109,
+      "eval_runtime": 6.2197,
+      "eval_samples_per_second": 522.692,
+      "eval_steps_per_second": 0.643,
+      "step": 225
+    },
+    {
+      "epoch": 1.14,
+      "eval_accuracy": 0.9895837389509754,
+      "eval_f1": 0.9402710389827672,
+      "eval_loss": 0.042259786278009415,
+      "eval_precision": 0.9347970725216235,
+      "eval_recall": 0.9458094917536183,
+      "eval_runtime": 6.2802,
+      "eval_samples_per_second": 517.656,
+      "eval_steps_per_second": 0.637,
+      "step": 250
+    },
+    {
+      "epoch": 1.25,
+      "eval_accuracy": 0.9892138156613839,
+      "eval_f1": 0.9354757720311323,
+      "eval_loss": 0.04323225095868111,
+      "eval_precision": 0.9304145163975363,
+      "eval_recall": 0.9405923931336251,
+      "eval_runtime": 6.1306,
+      "eval_samples_per_second": 530.294,
+      "eval_steps_per_second": 0.652,
+      "step": 275
+    },
+    {
+      "epoch": 1.36,
+      "eval_accuracy": 0.9900899497683112,
+      "eval_f1": 0.9432760787599497,
+      "eval_loss": 0.03824295476078987,
+      "eval_precision": 0.9392624728850325,
+      "eval_recall": 0.9473241332884551,
+      "eval_runtime": 6.3242,
+      "eval_samples_per_second": 514.058,
+      "eval_steps_per_second": 0.632,
+      "step": 300
+    },
+    {
+      "epoch": 1.48,
+      "eval_accuracy": 0.99005101047467,
+      "eval_f1": 0.9414020171709594,
+      "eval_loss": 0.0380987711250782,
+      "eval_precision": 0.932617671345995,
+      "eval_recall": 0.9503534163581285,
+      "eval_runtime": 6.1123,
+      "eval_samples_per_second": 531.88,
+      "eval_steps_per_second": 0.654,
+      "step": 325
+    },
+    {
+      "epoch": 1.59,
+      "eval_accuracy": 0.9902262372960554,
+      "eval_f1": 0.9429309339331834,
+      "eval_loss": 0.03868376836180687,
+      "eval_precision": 0.933674311169774,
+      "eval_recall": 0.9523729384045776,
+      "eval_runtime": 6.4317,
+      "eval_samples_per_second": 505.469,
+      "eval_steps_per_second": 0.622,
+      "step": 350
+    },
+    {
+      "epoch": 1.7,
+      "eval_accuracy": 0.990148358708773,
+      "eval_f1": 0.9439181825802665,
+      "eval_loss": 0.03645554929971695,
+      "eval_precision": 0.9403708034073827,
+      "eval_recall": 0.9474924267923258,
+      "eval_runtime": 6.1333,
+      "eval_samples_per_second": 530.054,
+      "eval_steps_per_second": 0.652,
+      "step": 375
+    },
+    {
+      "epoch": 1.82,
+      "eval_accuracy": 0.9905182819983646,
+      "eval_f1": 0.9473948735131512,
+      "eval_loss": 0.0382225401699543,
+      "eval_precision": 0.9431287525016678,
+      "eval_recall": 0.9516997643890945,
+      "eval_runtime": 6.1925,
+      "eval_samples_per_second": 524.987,
+      "eval_steps_per_second": 0.646,
+      "step": 400
+    },
+    {
+      "epoch": 1.93,
+      "eval_accuracy": 0.9903235855301585,
+      "eval_f1": 0.9460837582546184,
+      "eval_loss": 0.03733981028199196,
+      "eval_precision": 0.9398770968277694,
+      "eval_recall": 0.9523729384045776,
+      "eval_runtime": 6.4026,
+      "eval_samples_per_second": 507.766,
+      "eval_steps_per_second": 0.625,
+      "step": 425
+    },
+    {
+      "epoch": 2.05,
+      "eval_accuracy": 0.9910439624625209,
+      "eval_f1": 0.9497365559923059,
+      "eval_loss": 0.03666611388325691,
+      "eval_precision": 0.943973399833749,
+      "eval_recall": 0.9555705149781218,
+      "eval_runtime": 6.1803,
+      "eval_samples_per_second": 526.025,
+      "eval_steps_per_second": 0.647,
+      "step": 450
+    },
+    {
+      "epoch": 2.16,
+      "eval_accuracy": 0.99069350881975,
+      "eval_f1": 0.9474914433592119,
+      "eval_loss": 0.03960287570953369,
+      "eval_precision": 0.9400364419413616,
+      "eval_recall": 0.9550656344665096,
+      "eval_runtime": 6.4236,
+      "eval_samples_per_second": 506.1,
+      "eval_steps_per_second": 0.623,
+      "step": 475
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 4.636363636363636e-05,
+      "loss": 0.0771,
+      "step": 500
+    },
+    {
+      "epoch": 2.27,
+      "eval_accuracy": 0.991238658930727,
+      "eval_f1": 0.9507813152836967,
+      "eval_loss": 0.035283163189888,
+      "eval_precision": 0.9442323651452282,
+      "eval_recall": 0.9574217435207001,
+      "eval_runtime": 6.2034,
+      "eval_samples_per_second": 524.07,
+      "eval_steps_per_second": 0.645,
+      "step": 500
+    },
+    {
+      "epoch": 2.39,
+      "eval_accuracy": 0.9905572212920057,
+      "eval_f1": 0.9453602209020165,
+      "eval_loss": 0.03937030956149101,
+      "eval_precision": 0.9400898652021967,
+      "eval_recall": 0.9506900033658701,
+      "eval_runtime": 6.0362,
+      "eval_samples_per_second": 538.581,
+      "eval_steps_per_second": 0.663,
+      "step": 525
+    },
+    {
+      "epoch": 2.5,
+      "eval_accuracy": 0.9909660838752385,
+      "eval_f1": 0.9484536082474228,
+      "eval_loss": 0.036998968571424484,
+      "eval_precision": 0.9447320086825848,
+      "eval_recall": 0.9522046449007069,
+      "eval_runtime": 6.4336,
+      "eval_samples_per_second": 505.317,
+      "eval_steps_per_second": 0.622,
+      "step": 550
+    },
+    {
+      "epoch": 2.61,
+      "eval_accuracy": 0.9908492659943149,
+      "eval_f1": 0.9472013366750209,
+      "eval_loss": 0.035233963280916214,
+      "eval_precision": 0.940444591904446,
+      "eval_recall": 0.9540558734432851,
+      "eval_runtime": 6.3271,
+      "eval_samples_per_second": 513.819,
+      "eval_steps_per_second": 0.632,
+      "step": 575
+    },
+    {
+      "epoch": 2.73,
+      "eval_accuracy": 0.9908103267006737,
+      "eval_f1": 0.9448281601065159,
+      "eval_loss": 0.0385683998465538,
+      "eval_precision": 0.9344855967078189,
+      "eval_recall": 0.9554022214742511,
+      "eval_runtime": 6.4264,
+      "eval_samples_per_second": 505.878,
+      "eval_steps_per_second": 0.622,
+      "step": 600
+    },
+    {
+      "epoch": 2.84,
+      "eval_accuracy": 0.9916280518671391,
+      "eval_f1": 0.9501544627202138,
+      "eval_loss": 0.036591168493032455,
+      "eval_precision": 0.9428334714167357,
+      "eval_recall": 0.9575900370245709,
+      "eval_runtime": 6.0976,
+      "eval_samples_per_second": 533.163,
+      "eval_steps_per_second": 0.656,
+      "step": 625
+    },
+    {
+      "epoch": 2.95,
+      "eval_accuracy": 0.9913360071648301,
+      "eval_f1": 0.948574295509658,
+      "eval_loss": 0.035347189754247665,
+      "eval_precision": 0.9426624563736081,
+      "eval_recall": 0.9545607539548974,
+      "eval_runtime": 6.1569,
+      "eval_samples_per_second": 528.025,
+      "eval_steps_per_second": 0.65,
+      "step": 650
+    },
+    {
+      "epoch": 3.07,
+      "eval_accuracy": 0.9911023714029827,
+      "eval_f1": 0.9477730425336343,
+      "eval_loss": 0.035899706184864044,
+      "eval_precision": 0.9412448132780084,
+      "eval_recall": 0.9543924604510265,
+      "eval_runtime": 6.3818,
+      "eval_samples_per_second": 509.418,
+      "eval_steps_per_second": 0.627,
+      "step": 675
+    },
+    {
+      "epoch": 3.18,
+      "eval_accuracy": 0.9919979751567306,
+      "eval_f1": 0.9534164087981936,
+      "eval_loss": 0.0355631485581398,
+      "eval_precision": 0.9476309226932669,
+      "eval_recall": 0.9592729720632783,
+      "eval_runtime": 6.1016,
+      "eval_samples_per_second": 532.815,
+      "eval_steps_per_second": 0.656,
+      "step": 700
+    },
+    {
+      "epoch": 3.3,
+      "eval_accuracy": 0.9918422179821658,
+      "eval_f1": 0.953465015065283,
+      "eval_loss": 0.03445196524262428,
+      "eval_precision": 0.9483849483849484,
+      "eval_recall": 0.9585997980477954,
+      "eval_runtime": 6.4133,
+      "eval_samples_per_second": 506.912,
+      "eval_steps_per_second": 0.624,
+      "step": 725
+    },
+    {
+      "epoch": 3.41,
+      "eval_accuracy": 0.9915696429266773,
+      "eval_f1": 0.9491893698813304,
+      "eval_loss": 0.03445504605770111,
+      "eval_precision": 0.9427290836653387,
+      "eval_recall": 0.9557388084819926,
+      "eval_runtime": 6.2039,
+      "eval_samples_per_second": 524.023,
+      "eval_steps_per_second": 0.645,
+      "step": 750
+    },
+    {
+      "epoch": 3.52,
+      "eval_accuracy": 0.9913944161052919,
+      "eval_f1": 0.9478246374395733,
+      "eval_loss": 0.03635535016655922,
+      "eval_precision": 0.9389035667107001,
+      "eval_recall": 0.9569168630090878,
+      "eval_runtime": 6.2115,
+      "eval_samples_per_second": 523.384,
+      "eval_steps_per_second": 0.644,
+      "step": 775
+    },
+    {
+      "epoch": 3.64,
+      "eval_accuracy": 0.9914917643393949,
+      "eval_f1": 0.95067189717052,
+      "eval_loss": 0.03599384054541588,
+      "eval_precision": 0.943036926643484,
+      "eval_recall": 0.9584315045439246,
+      "eval_runtime": 6.3798,
+      "eval_samples_per_second": 509.575,
+      "eval_steps_per_second": 0.627,
+      "step": 800
+    },
+    {
+      "epoch": 3.75,
+      "eval_accuracy": 0.9914528250457537,
+      "eval_f1": 0.950514945993469,
+      "eval_loss": 0.03866244852542877,
+      "eval_precision": 0.9458423596067322,
+      "eval_recall": 0.9552339279703803,
+      "eval_runtime": 6.1387,
+      "eval_samples_per_second": 529.592,
+      "eval_steps_per_second": 0.652,
+      "step": 825
+    },
+    {
+      "epoch": 3.86,
+      "eval_accuracy": 0.9917059304544216,
+      "eval_f1": 0.9521419009370816,
+      "eval_loss": 0.034695982933044434,
+      "eval_precision": 0.9467554076539102,
+      "eval_recall": 0.9575900370245709,
+      "eval_runtime": 6.3766,
+      "eval_samples_per_second": 509.831,
+      "eval_steps_per_second": 0.627,
+      "step": 850
+    },
+    {
+      "epoch": 3.98,
+      "eval_accuracy": 0.9915307036330361,
+      "eval_f1": 0.9509402423735897,
+      "eval_loss": 0.03567422926425934,
+      "eval_precision": 0.9445459073551387,
+      "eval_recall": 0.9574217435207001,
+      "eval_runtime": 6.1035,
+      "eval_samples_per_second": 532.648,
+      "eval_steps_per_second": 0.655,
+      "step": 875
+    },
+    {
+      "epoch": 4.09,
+      "eval_accuracy": 0.9918032786885246,
+      "eval_f1": 0.9520702634880803,
+      "eval_loss": 0.03815401718020439,
+      "eval_precision": 0.9464493597206054,
+      "eval_recall": 0.9577583305284416,
+      "eval_runtime": 6.1453,
+      "eval_samples_per_second": 529.025,
+      "eval_steps_per_second": 0.651,
+      "step": 900
+    },
+    {
+      "epoch": 4.2,
+      "eval_accuracy": 0.9917643393948834,
+      "eval_f1": 0.9518385124382277,
+      "eval_loss": 0.03912338241934776,
+      "eval_precision": 0.9474737368684342,
+      "eval_recall": 0.9562436889936049,
+      "eval_runtime": 6.3668,
+      "eval_samples_per_second": 510.616,
+      "eval_steps_per_second": 0.628,
+      "step": 925
+    },
+    {
+      "epoch": 4.32,
+      "eval_accuracy": 0.9911802499902652,
+      "eval_f1": 0.9506493506493505,
+      "eval_loss": 0.0428401380777359,
+      "eval_precision": 0.9466043717670616,
+      "eval_recall": 0.9547290474587681,
+      "eval_runtime": 6.2553,
+      "eval_samples_per_second": 519.717,
+      "eval_steps_per_second": 0.639,
+      "step": 950
+    },
+    {
+      "epoch": 4.43,
+      "eval_accuracy": 0.9913360071648301,
+      "eval_f1": 0.9506028131279304,
+      "eval_loss": 0.04035865515470505,
+      "eval_precision": 0.9458513828723759,
+      "eval_recall": 0.9554022214742511,
+      "eval_runtime": 6.4802,
+      "eval_samples_per_second": 501.682,
+      "eval_steps_per_second": 0.617,
+      "step": 975
+    },
+    {
+      "epoch": 4.55,
+      "learning_rate": 3.2727272727272725e-05,
+      "loss": 0.0118,
+      "step": 1000
+    },
+    {
+      "epoch": 4.55,
+      "eval_accuracy": 0.9908687356411354,
+      "eval_f1": 0.9461397365349341,
+      "eval_loss": 0.04028761386871338,
+      "eval_precision": 0.9375413086582948,
+      "eval_recall": 0.9548973409626389,
+      "eval_runtime": 6.2199,
+      "eval_samples_per_second": 522.675,
+      "eval_steps_per_second": 0.643,
+      "step": 1000
+    },
+    {
+      "epoch": 4.66,
+      "eval_accuracy": 0.9919200965694482,
+      "eval_f1": 0.9533852205205458,
+      "eval_loss": 0.036938250064849854,
+      "eval_precision": 0.9482270684201765,
+      "eval_recall": 0.9585997980477954,
+      "eval_runtime": 6.0752,
+      "eval_samples_per_second": 535.129,
+      "eval_steps_per_second": 0.658,
+      "step": 1025
+    },
+    {
+      "epoch": 4.77,
+      "eval_accuracy": 0.9918032786885246,
+      "eval_f1": 0.9520227348712804,
+      "eval_loss": 0.037420712411403656,
+      "eval_precision": 0.9456991032879442,
+      "eval_recall": 0.9584315045439246,
+      "eval_runtime": 6.266,
+      "eval_samples_per_second": 518.831,
+      "eval_steps_per_second": 0.638,
+      "step": 1050
+    },
+    {
+      "epoch": 4.89,
+      "eval_accuracy": 0.9922900198590398,
+      "eval_f1": 0.9538745387453874,
+      "eval_loss": 0.035940222442150116,
+      "eval_precision": 0.9506853895018389,
+      "eval_recall": 0.9570851565129586,
+      "eval_runtime": 6.1032,
+      "eval_samples_per_second": 532.673,
+      "eval_steps_per_second": 0.655,
+      "step": 1075
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9919006269226276,
+      "eval_f1": 0.9523093627328155,
+      "eval_loss": 0.03730743005871773,
+      "eval_precision": 0.9452827060189023,
+      "eval_recall": 0.9594412655671491,
+      "eval_runtime": 6.3652,
+      "eval_samples_per_second": 510.745,
+      "eval_steps_per_second": 0.628,
+      "step": 1100
+    },
+    {
+      "epoch": 5.11,
+      "eval_accuracy": 0.9923873680931428,
+      "eval_f1": 0.9546215673141327,
+      "eval_loss": 0.037039875984191895,
+      "eval_precision": 0.9498500499833389,
+      "eval_recall": 0.9594412655671491,
+      "eval_runtime": 6.169,
+      "eval_samples_per_second": 526.993,
+      "eval_steps_per_second": 0.648,
+      "step": 1125
+    },
+    {
+      "epoch": 5.23,
+      "eval_accuracy": 0.9922316109185779,
+      "eval_f1": 0.9555313625324512,
+      "eval_loss": 0.038839343935251236,
+      "eval_precision": 0.9509918319719953,
+      "eval_recall": 0.9601144395826321,
+      "eval_runtime": 6.0785,
+      "eval_samples_per_second": 534.833,
+      "eval_steps_per_second": 0.658,
+      "step": 1150
+    },
+    {
+      "epoch": 5.34,
+      "eval_accuracy": 0.9919785055099101,
+      "eval_f1": 0.9522212908633696,
+      "eval_loss": 0.03950090706348419,
+      "eval_precision": 0.948563794255177,
+      "eval_recall": 0.9559071019858634,
+      "eval_runtime": 6.4405,
+      "eval_samples_per_second": 504.775,
+      "eval_steps_per_second": 0.621,
+      "step": 1175
+    },
+    {
+      "epoch": 5.45,
+      "eval_accuracy": 0.9923678984463222,
+      "eval_f1": 0.9542866711319491,
+      "eval_loss": 0.03910110890865326,
+      "eval_precision": 0.949516827724092,
+      "eval_recall": 0.9591046785594076,
+      "eval_runtime": 6.1207,
+      "eval_samples_per_second": 531.15,
+      "eval_steps_per_second": 0.654,
+      "step": 1200
+    },
+    {
+      "epoch": 5.57,
+      "eval_accuracy": 0.9923289591526809,
+      "eval_f1": 0.9552313883299799,
+      "eval_loss": 0.037824589759111404,
+      "eval_precision": 0.9517206815903776,
+      "eval_recall": 0.9587680915516661,
+      "eval_runtime": 6.1605,
+      "eval_samples_per_second": 527.72,
+      "eval_steps_per_second": 0.649,
+      "step": 1225
+    },
+    {
+      "epoch": 5.68,
+      "eval_accuracy": 0.9923678984463222,
+      "eval_f1": 0.956470785200067,
+      "eval_loss": 0.038752481341362,
+      "eval_precision": 0.9515323117921386,
+      "eval_recall": 0.9614607876135981,
+      "eval_runtime": 6.4555,
+      "eval_samples_per_second": 503.603,
+      "eval_steps_per_second": 0.62,
+      "step": 1250
+    },
+    {
+      "epoch": 5.8,
+      "eval_accuracy": 0.9924457770336046,
+      "eval_f1": 0.9560485558811219,
+      "eval_loss": 0.03838498517870903,
+      "eval_precision": 0.9511910711311011,
+      "eval_recall": 0.9609559071019859,
+      "eval_runtime": 6.1584,
+      "eval_samples_per_second": 527.9,
+      "eval_steps_per_second": 0.65,
+      "step": 1275
+    },
+    {
+      "epoch": 5.91,
+      "eval_accuracy": 0.9924068377399634,
+      "eval_f1": 0.9571045576407506,
+      "eval_loss": 0.03946718946099281,
+      "eval_precision": 0.9529529529529529,
+      "eval_recall": 0.9612924941097274,
+      "eval_runtime": 6.2271,
+      "eval_samples_per_second": 522.069,
+      "eval_steps_per_second": 0.642,
+      "step": 1300
+    },
+    {
+      "epoch": 6.02,
+      "eval_accuracy": 0.9919200965694482,
+      "eval_f1": 0.9533869885982562,
+      "eval_loss": 0.04075756296515465,
+      "eval_precision": 0.9498830604744404,
+      "eval_recall": 0.9569168630090878,
+      "eval_runtime": 6.3886,
+      "eval_samples_per_second": 508.877,
+      "eval_steps_per_second": 0.626,
+      "step": 1325
+    },
+    {
+      "epoch": 6.14,
+      "eval_accuracy": 0.9921732019781161,
+      "eval_f1": 0.9547998997409975,
+      "eval_loss": 0.04120802879333496,
+      "eval_precision": 0.948067031690725,
+      "eval_recall": 0.9616290811174689,
+      "eval_runtime": 6.1801,
+      "eval_samples_per_second": 526.047,
+      "eval_steps_per_second": 0.647,
+      "step": 1350
+    },
+    {
+      "epoch": 6.25,
+      "eval_accuracy": 0.9923873680931428,
+      "eval_f1": 0.9555667337357477,
+      "eval_loss": 0.0413355678319931,
+      "eval_precision": 0.952054794520548,
+      "eval_recall": 0.9591046785594076,
+      "eval_runtime": 6.3646,
+      "eval_samples_per_second": 510.793,
+      "eval_steps_per_second": 0.628,
+      "step": 1375
+    },
+    {
+      "epoch": 6.36,
+      "eval_accuracy": 0.9917448697480628,
+      "eval_f1": 0.9525004181301221,
+      "eval_loss": 0.04124680161476135,
+      "eval_precision": 0.9466422872340425,
+      "eval_recall": 0.9584315045439246,
+      "eval_runtime": 6.1566,
+      "eval_samples_per_second": 528.052,
+      "eval_steps_per_second": 0.65,
+      "step": 1400
+    },
+    {
+      "epoch": 6.48,
+      "eval_accuracy": 0.9920953233908337,
+      "eval_f1": 0.9555611348229978,
+      "eval_loss": 0.040540654212236404,
+      "eval_precision": 0.9503912102547029,
+      "eval_recall": 0.9607876135981152,
+      "eval_runtime": 6.4312,
+      "eval_samples_per_second": 505.501,
+      "eval_steps_per_second": 0.622,
+      "step": 1425
+    },
+    {
+      "epoch": 6.59,
+      "eval_accuracy": 0.9925041859740664,
+      "eval_f1": 0.9565508580996233,
+      "eval_loss": 0.04004018381237984,
+      "eval_precision": 0.9516908212560387,
+      "eval_recall": 0.9614607876135981,
+      "eval_runtime": 6.14,
+      "eval_samples_per_second": 529.477,
+      "eval_steps_per_second": 0.651,
+      "step": 1450
+    },
+    {
+      "epoch": 6.7,
+      "eval_accuracy": 0.9922900198590398,
+      "eval_f1": 0.9551813688531458,
+      "eval_loss": 0.039815619587898254,
+      "eval_precision": 0.9509591326105088,
+      "eval_recall": 0.9594412655671491,
+      "eval_runtime": 6.1824,
+      "eval_samples_per_second": 525.848,
+      "eval_steps_per_second": 0.647,
+      "step": 1475
+    },
+    {
+      "epoch": 6.82,
+      "learning_rate": 1.909090909090909e-05,
+      "loss": 0.0049,
+      "step": 1500
+    },
+    {
+      "epoch": 6.82,
+      "eval_accuracy": 0.9925431252677076,
+      "eval_f1": 0.956871283812076,
+      "eval_loss": 0.03951007500290871,
+      "eval_precision": 0.9523253875645941,
+      "eval_recall": 0.9614607876135981,
+      "eval_runtime": 6.3696,
+      "eval_samples_per_second": 510.391,
+      "eval_steps_per_second": 0.628,
+      "step": 1500
+    },
+    {
+      "epoch": 6.93,
+      "eval_accuracy": 0.9927183520890931,
+      "eval_f1": 0.9571476397723468,
+      "eval_loss": 0.03918459266424179,
+      "eval_precision": 0.952047952047952,
+      "eval_recall": 0.9623022551329519,
+      "eval_runtime": 6.0615,
+      "eval_samples_per_second": 536.339,
+      "eval_steps_per_second": 0.66,
+      "step": 1525
+    },
+    {
+      "epoch": 7.05,
+      "eval_accuracy": 0.9923484287995016,
+      "eval_f1": 0.9551738583996647,
+      "eval_loss": 0.03897989168763161,
+      "eval_precision": 0.9511096278992157,
+      "eval_recall": 0.9592729720632783,
+      "eval_runtime": 6.0213,
+      "eval_samples_per_second": 539.918,
+      "eval_steps_per_second": 0.664,
+      "step": 1550
+    },
+    {
+      "epoch": 7.16,
+      "eval_accuracy": 0.9925431252677076,
+      "eval_f1": 0.9565363034921699,
+      "eval_loss": 0.03931865468621254,
+      "eval_precision": 0.9519919986664445,
+      "eval_recall": 0.9611242006058566,
+      "eval_runtime": 6.2836,
+      "eval_samples_per_second": 517.381,
+      "eval_steps_per_second": 0.637,
+      "step": 1575
+    },
+    {
+      "epoch": 7.27,
+      "eval_accuracy": 0.9925236556208871,
+      "eval_f1": 0.9562233196618398,
+      "eval_loss": 0.03892602398991585,
+      "eval_precision": 0.9512073272273106,
+      "eval_recall": 0.9612924941097274,
+      "eval_runtime": 6.0872,
+      "eval_samples_per_second": 534.07,
+      "eval_steps_per_second": 0.657,
+      "step": 1600
+    },
+    {
+      "epoch": 7.39,
+      "eval_accuracy": 0.9923678984463222,
+      "eval_f1": 0.9565435820145692,
+      "eval_loss": 0.0404973067343235,
+      "eval_precision": 0.9518413597733711,
+      "eval_recall": 0.9612924941097274,
+      "eval_runtime": 6.4196,
+      "eval_samples_per_second": 506.419,
+      "eval_steps_per_second": 0.623,
+      "step": 1625
+    },
+    {
+      "epoch": 7.5,
+      "eval_accuracy": 0.9924847163272458,
+      "eval_f1": 0.9558737335677803,
+      "eval_loss": 0.04104885458946228,
+      "eval_precision": 0.9511748041993001,
+      "eval_recall": 0.9606193200942443,
+      "eval_runtime": 6.0828,
+      "eval_samples_per_second": 534.456,
+      "eval_steps_per_second": 0.658,
+      "step": 1650
+    },
+    {
+      "epoch": 7.61,
+      "eval_accuracy": 0.9925431252677076,
+      "eval_f1": 0.9569442117607639,
+      "eval_loss": 0.04079214483499527,
+      "eval_precision": 0.95263509006004,
+      "eval_recall": 0.9612924941097274,
+      "eval_runtime": 6.2616,
+      "eval_samples_per_second": 519.196,
+      "eval_steps_per_second": 0.639,
+      "step": 1675
+    },
+    {
+      "epoch": 7.73,
+      "eval_accuracy": 0.9921732019781161,
+      "eval_f1": 0.9545302574389837,
+      "eval_loss": 0.043598320335149765,
+      "eval_precision": 0.9481899701095982,
+      "eval_recall": 0.9609559071019859,
+      "eval_runtime": 6.3776,
+      "eval_samples_per_second": 509.751,
+      "eval_steps_per_second": 0.627,
+      "step": 1700
+    },
+    {
+      "epoch": 7.84,
+      "eval_accuracy": 0.9924068377399634,
+      "eval_f1": 0.9559548683660676,
+      "eval_loss": 0.0419035442173481,
+      "eval_precision": 0.9495268138801262,
+      "eval_recall": 0.9624705486368226,
+      "eval_runtime": 6.107,
+      "eval_samples_per_second": 532.344,
+      "eval_steps_per_second": 0.655,
+      "step": 1725
+    },
+    {
+      "epoch": 7.95,
+      "eval_accuracy": 0.9925625949145283,
+      "eval_f1": 0.957126109529392,
+      "eval_loss": 0.04293340817093849,
+      "eval_precision": 0.9525,
+      "eval_recall": 0.9617973746213396,
+      "eval_runtime": 6.1631,
+      "eval_samples_per_second": 527.491,
+      "eval_steps_per_second": 0.649,
+      "step": 1750
+    },
+    {
+      "epoch": 8.07,
+      "eval_accuracy": 0.9924068377399634,
+      "eval_f1": 0.9561506276150629,
+      "eval_loss": 0.041886329650878906,
+      "eval_precision": 0.9508988015978695,
+      "eval_recall": 0.9614607876135981,
+      "eval_runtime": 6.3831,
+      "eval_samples_per_second": 509.311,
+      "eval_steps_per_second": 0.627,
+      "step": 1775
+    },
+    {
+      "epoch": 8.18,
+      "eval_accuracy": 0.9922900198590398,
+      "eval_f1": 0.9555313625324512,
+      "eval_loss": 0.04220963269472122,
+      "eval_precision": 0.9509918319719953,
+      "eval_recall": 0.9601144395826321,
+      "eval_runtime": 6.1467,
+      "eval_samples_per_second": 528.904,
+      "eval_steps_per_second": 0.651,
+      "step": 1800
+    },
+    {
+      "epoch": 8.3,
+      "eval_accuracy": 0.9923873680931428,
+      "eval_f1": 0.9561793045664014,
+      "eval_loss": 0.041702426970005035,
+      "eval_precision": 0.9521107959285834,
+      "eval_recall": 0.9602827330865029,
+      "eval_runtime": 6.4978,
+      "eval_samples_per_second": 500.322,
+      "eval_steps_per_second": 0.616,
+      "step": 1825
+    },
+    {
+      "epoch": 8.41,
+      "eval_accuracy": 0.9924652466804252,
+      "eval_f1": 0.9570171763720151,
+      "eval_loss": 0.04150727763772011,
+      "eval_precision": 0.952945102619723,
+      "eval_recall": 0.9611242006058566,
+      "eval_runtime": 6.1888,
+      "eval_samples_per_second": 525.307,
+      "eval_steps_per_second": 0.646,
+      "step": 1850
+    },
+    {
+      "epoch": 8.52,
+      "eval_accuracy": 0.9924263073867841,
+      "eval_f1": 0.9566965407488064,
+      "eval_loss": 0.04162871465086937,
+      "eval_precision": 0.952309488077372,
+      "eval_recall": 0.9611242006058566,
+      "eval_runtime": 6.155,
+      "eval_samples_per_second": 528.192,
+      "eval_steps_per_second": 0.65,
+      "step": 1875
+    },
+    {
+      "epoch": 8.64,
+      "eval_accuracy": 0.9922316109185779,
+      "eval_f1": 0.9555611348229978,
+      "eval_loss": 0.04189736768603325,
+      "eval_precision": 0.9503912102547029,
+      "eval_recall": 0.9607876135981152,
+      "eval_runtime": 6.4706,
+      "eval_samples_per_second": 502.422,
+      "eval_steps_per_second": 0.618,
+      "step": 1900
+    },
+    {
+      "epoch": 8.75,
+      "eval_accuracy": 0.9923873680931428,
+      "eval_f1": 0.9564489112227805,
+      "eval_loss": 0.04165585711598396,
+      "eval_precision": 0.9519839946648883,
+      "eval_recall": 0.9609559071019859,
+      "eval_runtime": 6.1453,
+      "eval_samples_per_second": 529.021,
+      "eval_steps_per_second": 0.651,
+      "step": 1925
+    },
+    {
+      "epoch": 8.86,
+      "eval_accuracy": 0.9926015342081694,
+      "eval_f1": 0.9577818730105546,
+      "eval_loss": 0.041886311024427414,
+      "eval_precision": 0.9534689793195463,
+      "eval_recall": 0.9621339616290812,
+      "eval_runtime": 6.3199,
+      "eval_samples_per_second": 514.406,
+      "eval_steps_per_second": 0.633,
+      "step": 1950
+    },
+    {
+      "epoch": 8.98,
+      "eval_accuracy": 0.9926599431486313,
+      "eval_f1": 0.9575341318368372,
+      "eval_loss": 0.04215257614850998,
+      "eval_precision": 0.9531432382858096,
+      "eval_recall": 0.9619656681252103,
+      "eval_runtime": 6.4751,
+      "eval_samples_per_second": 502.081,
+      "eval_steps_per_second": 0.618,
+      "step": 1975
+    },
+    {
+      "epoch": 9.09,
+      "learning_rate": 5.4545454545454545e-06,
+      "loss": 0.0022,
+      "step": 2000
+    },
+    {
+      "epoch": 9.09,
+      "eval_accuracy": 0.9925820645613489,
+      "eval_f1": 0.9571847507331379,
+      "eval_loss": 0.04227477312088013,
+      "eval_precision": 0.953111963957951,
+      "eval_recall": 0.9612924941097274,
+      "eval_runtime": 6.1147,
+      "eval_samples_per_second": 531.668,
+      "eval_steps_per_second": 0.654,
+      "step": 2000
+    },
+    {
+      "epoch": 9.2,
+      "eval_accuracy": 0.9925431252677076,
+      "eval_f1": 0.9567110441262665,
+      "eval_loss": 0.042577099055051804,
+      "eval_precision": 0.9520079986668889,
+      "eval_recall": 0.9614607876135981,
+      "eval_runtime": 6.2941,
+      "eval_samples_per_second": 516.519,
+      "eval_steps_per_second": 0.636,
+      "step": 2025
+    },
+    {
+      "epoch": 9.32,
+      "eval_accuracy": 0.9924652466804252,
+      "eval_f1": 0.9560338330123105,
+      "eval_loss": 0.04250513017177582,
+      "eval_precision": 0.9514919153192198,
+      "eval_recall": 0.9606193200942443,
+      "eval_runtime": 6.0627,
+      "eval_samples_per_second": 536.233,
+      "eval_steps_per_second": 0.66,
+      "step": 2050
+    },
+    {
+      "epoch": 9.43,
+      "eval_accuracy": 0.9925431252677076,
+      "eval_f1": 0.956463496316142,
+      "eval_loss": 0.0422191396355629,
+      "eval_precision": 0.951682772409197,
+      "eval_recall": 0.9612924941097274,
+      "eval_runtime": 6.244,
+      "eval_samples_per_second": 520.664,
+      "eval_steps_per_second": 0.641,
+      "step": 2075
+    },
+    {
+      "epoch": 9.55,
+      "eval_accuracy": 0.9924847163272458,
+      "eval_f1": 0.9559537765868363,
+      "eval_loss": 0.0423436276614666,
+      "eval_precision": 0.9513333333333334,
+      "eval_recall": 0.9606193200942443,
+      "eval_runtime": 6.3539,
+      "eval_samples_per_second": 511.652,
+      "eval_steps_per_second": 0.63,
+      "step": 2100
+    },
+    {
+      "epoch": 9.66,
+      "eval_accuracy": 0.9924652466804252,
+      "eval_f1": 0.9558663428523575,
+      "eval_loss": 0.04235740005970001,
+      "eval_precision": 0.951325220870145,
+      "eval_recall": 0.9604510265903736,
+      "eval_runtime": 6.0977,
+      "eval_samples_per_second": 533.149,
+      "eval_steps_per_second": 0.656,
+      "step": 2125
+    },
+    {
+      "epoch": 9.77,
+      "eval_accuracy": 0.9924652466804252,
+      "eval_f1": 0.9566164154103852,
+      "eval_loss": 0.042295120656490326,
+      "eval_precision": 0.9521507169056352,
+      "eval_recall": 0.9611242006058566,
+      "eval_runtime": 6.4502,
+      "eval_samples_per_second": 504.016,
+      "eval_steps_per_second": 0.62,
+      "step": 2150
+    },
+    {
+      "epoch": 9.89,
+      "eval_accuracy": 0.9924847163272458,
+      "eval_f1": 0.9567037936521229,
+      "eval_loss": 0.04226445034146309,
+      "eval_precision": 0.9521586931155193,
+      "eval_recall": 0.9612924941097274,
+      "eval_runtime": 6.2159,
+      "eval_samples_per_second": 523.014,
+      "eval_steps_per_second": 0.644,
+      "step": 2175
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.9925236556208871,
+      "eval_f1": 0.9570387739720292,
+      "eval_loss": 0.04224075376987457,
+      "eval_precision": 0.952492082013669,
+      "eval_recall": 0.9616290811174689,
+      "eval_runtime": 6.1877,
+      "eval_samples_per_second": 525.397,
+      "eval_steps_per_second": 0.646,
+      "step": 2200
+    },
+    {
+      "epoch": 10.0,
+      "step": 2200,
+      "total_flos": 4144211411102244.0,
+      "train_loss": 0.021953743980689482,
+      "train_runtime": 1347.1839,
+      "train_samples_per_second": 104.232,
+      "train_steps_per_second": 1.633
+    }
+  ],
+  "max_steps": 2200,
+  "num_train_epochs": 10,
+  "total_flos": 4144211411102244.0,
+  "trial_name": null,
+  "trial_params": null
+}