{
  "best_metric": 0.9149749926448956,
  "best_model_checkpoint": "trillsson3-ft-keyword-spotting-14/checkpoint-23955",
  "epoch": 20.0,
  "global_step": 31940,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.06,
      "learning_rate": 8.73512836568566e-06,
      "loss": 8.0793,
      "step": 100
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.812773951158422e-05,
      "loss": 7.1754,
      "step": 200
    },
    {
      "epoch": 0.19,
      "learning_rate": 2.7520350657482777e-05,
      "loss": 5.6723,
      "step": 300
    },
    {
      "epoch": 0.25,
      "learning_rate": 3.691296180338134e-05,
      "loss": 4.1468,
      "step": 400
    },
    {
      "epoch": 0.31,
      "learning_rate": 4.6305572949279896e-05,
      "loss": 3.3576,
      "step": 500
    },
    {
      "epoch": 0.38,
      "learning_rate": 5.5698184095178454e-05,
      "loss": 2.955,
      "step": 600
    },
    {
      "epoch": 0.44,
      "learning_rate": 6.509079524107701e-05,
      "loss": 2.7689,
      "step": 700
    },
    {
      "epoch": 0.5,
      "learning_rate": 7.448340638697557e-05,
      "loss": 2.5858,
      "step": 800
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.387601753287413e-05,
      "loss": 2.3275,
      "step": 900
    },
    {
      "epoch": 0.63,
      "learning_rate": 9.326862867877268e-05,
      "loss": 2.0771,
      "step": 1000
    },
    {
      "epoch": 0.69,
      "learning_rate": 0.00010266123982467126,
      "loss": 1.8958,
      "step": 1100
    },
    {
      "epoch": 0.75,
      "learning_rate": 0.0001120538509705698,
      "loss": 1.6778,
      "step": 1200
    },
    {
      "epoch": 0.81,
      "learning_rate": 0.00012144646211646837,
      "loss": 1.5346,
      "step": 1300
    },
    {
      "epoch": 0.88,
      "learning_rate": 0.00013083907326236693,
      "loss": 1.4238,
      "step": 1400
    },
    {
      "epoch": 0.94,
      "learning_rate": 0.0001402316844082655,
      "loss": 1.2824,
      "step": 1500
    },
    {
      "epoch": 1.0,
      "eval_accuracy": 0.6891732862606649,
      "eval_loss": 0.7817752957344055,
      "eval_runtime": 152.2428,
      "eval_samples_per_second": 44.652,
      "eval_steps_per_second": 0.703,
      "step": 1597
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.00014962429555416404,
      "loss": 1.2121,
      "step": 1600
    },
    {
      "epoch": 1.06,
      "learning_rate": 0.0001590169067000626,
      "loss": 1.1391,
      "step": 1700
    },
    {
      "epoch": 1.13,
      "learning_rate": 0.00016840951784596116,
      "loss": 1.12,
      "step": 1800
    },
    {
      "epoch": 1.19,
      "learning_rate": 0.00017780212899185972,
      "loss": 1.053,
      "step": 1900
    },
    {
      "epoch": 1.25,
      "learning_rate": 0.0001871947401377583,
      "loss": 1.0245,
      "step": 2000
    },
    {
      "epoch": 1.31,
      "learning_rate": 0.00019658735128365683,
      "loss": 0.9887,
      "step": 2100
    },
    {
      "epoch": 1.38,
      "learning_rate": 0.0002059799624295554,
      "loss": 0.9671,
      "step": 2200
    },
    {
      "epoch": 1.44,
      "learning_rate": 0.00021537257357545395,
      "loss": 0.8912,
      "step": 2300
    },
    {
      "epoch": 1.5,
      "learning_rate": 0.00022476518472135253,
      "loss": 0.9015,
      "step": 2400
    },
    {
      "epoch": 1.57,
      "learning_rate": 0.0002341577958672511,
      "loss": 0.89,
      "step": 2500
    },
    {
      "epoch": 1.63,
      "learning_rate": 0.00024355040701314962,
      "loss": 0.8173,
      "step": 2600
    },
    {
      "epoch": 1.69,
      "learning_rate": 0.0002529430181590482,
      "loss": 0.8338,
      "step": 2700
    },
    {
      "epoch": 1.75,
      "learning_rate": 0.00026233562930494674,
      "loss": 0.8313,
      "step": 2800
    },
    {
      "epoch": 1.82,
      "learning_rate": 0.0002717282404508453,
      "loss": 0.8395,
      "step": 2900
    },
    {
      "epoch": 1.88,
      "learning_rate": 0.00028112085159674385,
      "loss": 0.8036,
      "step": 3000
    },
    {
      "epoch": 1.94,
      "learning_rate": 0.00029051346274264244,
      "loss": 0.8003,
      "step": 3100
    },
    {
      "epoch": 2.0,
      "eval_accuracy": 0.8734922035892909,
      "eval_loss": 0.44425612688064575,
      "eval_runtime": 147.8186,
      "eval_samples_per_second": 45.989,
      "eval_steps_per_second": 0.724,
      "step": 3194
    },
    {
      "epoch": 2.0,
      "learning_rate": 0.00029990607388854097,
      "loss": 0.7951,
      "step": 3200
    },
    {
      "epoch": 2.07,
      "learning_rate": 0.0002989668127739511,
      "loss": 0.8114,
      "step": 3300
    },
    {
      "epoch": 2.13,
      "learning_rate": 0.00029792318931329574,
      "loss": 0.8343,
      "step": 3400
    },
    {
      "epoch": 2.19,
      "learning_rate": 0.00029687956585264035,
      "loss": 0.7617,
      "step": 3500
    },
    {
      "epoch": 2.25,
      "learning_rate": 0.00029583594239198497,
      "loss": 0.7779,
      "step": 3600
    },
    {
      "epoch": 2.32,
      "learning_rate": 0.0002947923189313295,
      "loss": 0.7512,
      "step": 3700
    },
    {
      "epoch": 2.38,
      "learning_rate": 0.00029374869547067414,
      "loss": 0.7962,
      "step": 3800
    },
    {
      "epoch": 2.44,
      "learning_rate": 0.00029270507201001875,
      "loss": 0.7134,
      "step": 3900
    },
    {
      "epoch": 2.5,
      "learning_rate": 0.00029166144854936337,
      "loss": 0.786,
      "step": 4000
    },
    {
      "epoch": 2.57,
      "learning_rate": 0.000290617825088708,
      "loss": 0.7808,
      "step": 4100
    },
    {
      "epoch": 2.63,
      "learning_rate": 0.0002895742016280526,
      "loss": 0.7379,
      "step": 4200
    },
    {
      "epoch": 2.69,
      "learning_rate": 0.00028853057816739715,
      "loss": 0.7545,
      "step": 4300
    },
    {
      "epoch": 2.76,
      "learning_rate": 0.00028748695470674177,
      "loss": 0.7557,
      "step": 4400
    },
    {
      "epoch": 2.82,
      "learning_rate": 0.0002864433312460864,
      "loss": 0.7633,
      "step": 4500
    },
    {
      "epoch": 2.88,
      "learning_rate": 0.000285399707785431,
      "loss": 0.7414,
      "step": 4600
    },
    {
      "epoch": 2.94,
      "learning_rate": 0.0002843560843247756,
      "loss": 0.7232,
      "step": 4700
    },
    {
      "epoch": 3.0,
      "eval_accuracy": 0.8833480435422183,
      "eval_loss": 0.372787207365036,
      "eval_runtime": 148.4355,
      "eval_samples_per_second": 45.798,
      "eval_steps_per_second": 0.721,
      "step": 4791
    },
    {
      "epoch": 3.01,
      "learning_rate": 0.00028331246086412017,
      "loss": 0.7661,
      "step": 4800
    },
    {
      "epoch": 3.07,
      "learning_rate": 0.00028226883740346484,
      "loss": 0.7224,
      "step": 4900
    },
    {
      "epoch": 3.13,
      "learning_rate": 0.0002812252139428094,
      "loss": 0.7186,
      "step": 5000
    },
    {
      "epoch": 3.19,
      "learning_rate": 0.0002801920267167606,
      "loss": 0.7151,
      "step": 5100
    },
    {
      "epoch": 3.26,
      "learning_rate": 0.00027914840325610516,
      "loss": 0.7175,
      "step": 5200
    },
    {
      "epoch": 3.32,
      "learning_rate": 0.0002781047797954498,
      "loss": 0.6871,
      "step": 5300
    },
    {
      "epoch": 3.38,
      "learning_rate": 0.0002770611563347944,
      "loss": 0.7446,
      "step": 5400
    },
    {
      "epoch": 3.44,
      "learning_rate": 0.000276017532874139,
      "loss": 0.7128,
      "step": 5500
    },
    {
      "epoch": 3.51,
      "learning_rate": 0.0002749739094134836,
      "loss": 0.6896,
      "step": 5600
    },
    {
      "epoch": 3.57,
      "learning_rate": 0.0002739302859528282,
      "loss": 0.714,
      "step": 5700
    },
    {
      "epoch": 3.63,
      "learning_rate": 0.0002728866624921728,
      "loss": 0.7478,
      "step": 5800
    },
    {
      "epoch": 3.69,
      "learning_rate": 0.0002718430390315174,
      "loss": 0.6853,
      "step": 5900
    },
    {
      "epoch": 3.76,
      "learning_rate": 0.000270799415570862,
      "loss": 0.7165,
      "step": 6000
    },
    {
      "epoch": 3.82,
      "learning_rate": 0.0002697557921102066,
      "loss": 0.704,
      "step": 6100
    },
    {
      "epoch": 3.88,
      "learning_rate": 0.00026871216864955125,
      "loss": 0.6954,
      "step": 6200
    },
    {
      "epoch": 3.94,
      "learning_rate": 0.0002676685451888958,
      "loss": 0.73,
      "step": 6300
    },
    {
      "epoch": 4.0,
      "eval_accuracy": 0.8973227419829362,
      "eval_loss": 0.346542090177536,
      "eval_runtime": 147.4068,
      "eval_samples_per_second": 46.117,
      "eval_steps_per_second": 0.726,
      "step": 6388
    },
    {
      "epoch": 4.01,
      "learning_rate": 0.0002666249217282404,
      "loss": 0.7149,
      "step": 6400
    },
    {
      "epoch": 4.07,
      "learning_rate": 0.00026558129826758503,
      "loss": 0.7107,
      "step": 6500
    },
    {
      "epoch": 4.13,
      "learning_rate": 0.00026453767480692965,
      "loss": 0.6744,
      "step": 6600
    },
    {
      "epoch": 4.2,
      "learning_rate": 0.0002634940513462742,
      "loss": 0.727,
      "step": 6700
    },
    {
      "epoch": 4.26,
      "learning_rate": 0.0002624504278856189,
      "loss": 0.7,
      "step": 6800
    },
    {
      "epoch": 4.32,
      "learning_rate": 0.00026140680442496343,
      "loss": 0.7239,
      "step": 6900
    },
    {
      "epoch": 4.38,
      "learning_rate": 0.00026036318096430805,
      "loss": 0.6847,
      "step": 7000
    },
    {
      "epoch": 4.45,
      "learning_rate": 0.00025931955750365266,
      "loss": 0.7151,
      "step": 7100
    },
    {
      "epoch": 4.51,
      "learning_rate": 0.0002582759340429973,
      "loss": 0.7228,
      "step": 7200
    },
    {
      "epoch": 4.57,
      "learning_rate": 0.0002572427468169484,
      "loss": 0.6925,
      "step": 7300
    },
    {
      "epoch": 4.63,
      "learning_rate": 0.000256199123356293,
      "loss": 0.7064,
      "step": 7400
    },
    {
      "epoch": 4.7,
      "learning_rate": 0.00025515549989563765,
      "loss": 0.6861,
      "step": 7500
    },
    {
      "epoch": 4.76,
      "learning_rate": 0.0002541118764349822,
      "loss": 0.7057,
      "step": 7600
    },
    {
      "epoch": 4.82,
      "learning_rate": 0.0002530682529743269,
      "loss": 0.6811,
      "step": 7700
    },
    {
      "epoch": 4.88,
      "learning_rate": 0.00025202462951367144,
      "loss": 0.6676,
      "step": 7800
    },
    {
      "epoch": 4.95,
      "learning_rate": 0.00025098100605301605,
      "loss": 0.7015,
      "step": 7900
    },
    {
      "epoch": 5.0,
      "eval_accuracy": 0.910856134157105,
      "eval_loss": 0.3211327791213989,
      "eval_runtime": 150.4771,
      "eval_samples_per_second": 45.176,
      "eval_steps_per_second": 0.711,
      "step": 7985
    },
    {
      "epoch": 5.01,
      "learning_rate": 0.00024993738259236067,
      "loss": 0.708,
      "step": 8000
    },
    {
      "epoch": 5.07,
      "learning_rate": 0.0002488937591317053,
      "loss": 0.7372,
      "step": 8100
    },
    {
      "epoch": 5.13,
      "learning_rate": 0.00024785013567104984,
      "loss": 0.7089,
      "step": 8200
    },
    {
      "epoch": 5.2,
      "learning_rate": 0.00024680651221039445,
      "loss": 0.6962,
      "step": 8300
    },
    {
      "epoch": 5.26,
      "learning_rate": 0.00024576288874973907,
      "loss": 0.7209,
      "step": 8400
    },
    {
      "epoch": 5.32,
      "learning_rate": 0.0002447192652890837,
      "loss": 0.7091,
      "step": 8500
    },
    {
      "epoch": 5.39,
      "learning_rate": 0.0002436756418284283,
      "loss": 0.6898,
      "step": 8600
    },
    {
      "epoch": 5.45,
      "learning_rate": 0.00024263201836777288,
      "loss": 0.726,
      "step": 8700
    },
    {
      "epoch": 5.51,
      "learning_rate": 0.00024158839490711747,
      "loss": 0.682,
      "step": 8800
    },
    {
      "epoch": 5.57,
      "learning_rate": 0.0002405447714464621,
      "loss": 0.6855,
      "step": 8900
    },
    {
      "epoch": 5.64,
      "learning_rate": 0.0002395011479858067,
      "loss": 0.7108,
      "step": 9000
    },
    {
      "epoch": 5.7,
      "learning_rate": 0.00023845752452515128,
      "loss": 0.6945,
      "step": 9100
    },
    {
      "epoch": 5.76,
      "learning_rate": 0.00023741390106449592,
      "loss": 0.6621,
      "step": 9200
    },
    {
      "epoch": 5.82,
      "learning_rate": 0.0002363702776038405,
      "loss": 0.7176,
      "step": 9300
    },
    {
      "epoch": 5.89,
      "learning_rate": 0.00023532665414318512,
      "loss": 0.6824,
      "step": 9400
    },
    {
      "epoch": 5.95,
      "learning_rate": 0.00023428303068252974,
      "loss": 0.6981,
      "step": 9500
    },
    {
      "epoch": 6.0,
      "eval_accuracy": 0.9080611944689615,
      "eval_loss": 0.3200249671936035,
      "eval_runtime": 148.3702,
      "eval_samples_per_second": 45.818,
      "eval_steps_per_second": 0.721,
      "step": 9582
    },
    {
      "epoch": 6.01,
      "learning_rate": 0.00023323940722187433,
      "loss": 0.6934,
      "step": 9600
    },
    {
      "epoch": 6.07,
      "learning_rate": 0.00023219578376121894,
      "loss": 0.7101,
      "step": 9700
    },
    {
      "epoch": 6.14,
      "learning_rate": 0.00023115216030056353,
      "loss": 0.6922,
      "step": 9800
    },
    {
      "epoch": 6.2,
      "learning_rate": 0.00023010853683990814,
      "loss": 0.7027,
      "step": 9900
    },
    {
      "epoch": 6.26,
      "learning_rate": 0.00022906491337925275,
      "loss": 0.6931,
      "step": 10000
    },
    {
      "epoch": 6.32,
      "learning_rate": 0.00022802128991859734,
      "loss": 0.6782,
      "step": 10100
    },
    {
      "epoch": 6.39,
      "learning_rate": 0.00022697766645794195,
      "loss": 0.6842,
      "step": 10200
    },
    {
      "epoch": 6.45,
      "learning_rate": 0.00022593404299728657,
      "loss": 0.7295,
      "step": 10300
    },
    {
      "epoch": 6.51,
      "learning_rate": 0.00022489041953663115,
      "loss": 0.7145,
      "step": 10400
    },
    {
      "epoch": 6.57,
      "learning_rate": 0.00022384679607597577,
      "loss": 0.6637,
      "step": 10500
    },
    {
      "epoch": 6.64,
      "learning_rate": 0.00022280317261532038,
      "loss": 0.6666,
      "step": 10600
    },
    {
      "epoch": 6.7,
      "learning_rate": 0.00022175954915466497,
      "loss": 0.7068,
      "step": 10700
    },
    {
      "epoch": 6.76,
      "learning_rate": 0.00022071592569400955,
      "loss": 0.6759,
      "step": 10800
    },
    {
      "epoch": 6.83,
      "learning_rate": 0.0002196723022333542,
      "loss": 0.6926,
      "step": 10900
    },
    {
      "epoch": 6.89,
      "learning_rate": 0.00021862867877269878,
      "loss": 0.6825,
      "step": 11000
    },
    {
      "epoch": 6.95,
      "learning_rate": 0.00021758505531204342,
      "loss": 0.6807,
      "step": 11100
    },
    {
      "epoch": 7.0,
      "eval_accuracy": 0.9058546631362165,
      "eval_loss": 0.3208906650543213,
      "eval_runtime": 149.169,
      "eval_samples_per_second": 45.572,
      "eval_steps_per_second": 0.717,
      "step": 11179
    },
    {
      "epoch": 7.01,
      "learning_rate": 0.000216541431851388,
      "loss": 0.677,
      "step": 11200
    },
    {
      "epoch": 7.08,
      "learning_rate": 0.00021550824462533916,
      "loss": 0.7379,
      "step": 11300
    },
    {
      "epoch": 7.14,
      "learning_rate": 0.00021447505739929034,
      "loss": 0.7156,
      "step": 11400
    },
    {
      "epoch": 7.2,
      "learning_rate": 0.00021343143393863493,
      "loss": 0.6406,
      "step": 11500
    },
    {
      "epoch": 7.26,
      "learning_rate": 0.0002123878104779795,
      "loss": 0.6888,
      "step": 11600
    },
    {
      "epoch": 7.33,
      "learning_rate": 0.00021134418701732413,
      "loss": 0.6968,
      "step": 11700
    },
    {
      "epoch": 7.39,
      "learning_rate": 0.00021030056355666874,
      "loss": 0.6989,
      "step": 11800
    },
    {
      "epoch": 7.45,
      "learning_rate": 0.00020925694009601333,
      "loss": 0.6751,
      "step": 11900
    },
    {
      "epoch": 7.51,
      "learning_rate": 0.00020821331663535794,
      "loss": 0.6879,
      "step": 12000
    },
    {
      "epoch": 7.58,
      "learning_rate": 0.00020716969317470255,
      "loss": 0.678,
      "step": 12100
    },
    {
      "epoch": 7.64,
      "learning_rate": 0.00020612606971404714,
      "loss": 0.6501,
      "step": 12200
    },
    {
      "epoch": 7.7,
      "learning_rate": 0.00020508244625339176,
      "loss": 0.6679,
      "step": 12300
    },
    {
      "epoch": 7.76,
      "learning_rate": 0.00020403882279273637,
      "loss": 0.7116,
      "step": 12400
    },
    {
      "epoch": 7.83,
      "learning_rate": 0.00020299519933208098,
      "loss": 0.6899,
      "step": 12500
    },
    {
      "epoch": 7.89,
      "learning_rate": 0.00020195157587142557,
      "loss": 0.6892,
      "step": 12600
    },
    {
      "epoch": 7.95,
      "learning_rate": 0.00020090795241077016,
      "loss": 0.6873,
      "step": 12700
    },
    {
      "epoch": 8.0,
      "eval_accuracy": 0.902177110914975,
      "eval_loss": 0.3205910921096802,
      "eval_runtime": 147.3348,
      "eval_samples_per_second": 46.14,
      "eval_steps_per_second": 0.726,
      "step": 12776
    },
    {
      "epoch": 8.02,
      "learning_rate": 0.0001998643289501148,
      "loss": 0.6847,
      "step": 12800
    },
    {
      "epoch": 8.08,
      "learning_rate": 0.00019882070548945938,
      "loss": 0.6833,
      "step": 12900
    },
    {
      "epoch": 8.14,
      "learning_rate": 0.00019777708202880397,
      "loss": 0.6737,
      "step": 13000
    },
    {
      "epoch": 8.2,
      "learning_rate": 0.0001967334585681486,
      "loss": 0.6568,
      "step": 13100
    },
    {
      "epoch": 8.27,
      "learning_rate": 0.0001956898351074932,
      "loss": 0.7059,
      "step": 13200
    },
    {
      "epoch": 8.33,
      "learning_rate": 0.00019464621164683778,
      "loss": 0.6831,
      "step": 13300
    },
    {
      "epoch": 8.39,
      "learning_rate": 0.00019360258818618243,
      "loss": 0.7174,
      "step": 13400
    },
    {
      "epoch": 8.45,
      "learning_rate": 0.00019256940096013358,
      "loss": 0.6966,
      "step": 13500
    },
    {
      "epoch": 8.52,
      "learning_rate": 0.00019152577749947816,
      "loss": 0.699,
      "step": 13600
    },
    {
      "epoch": 8.58,
      "learning_rate": 0.00019048215403882278,
      "loss": 0.6774,
      "step": 13700
    },
    {
      "epoch": 8.64,
      "learning_rate": 0.0001894385305781674,
      "loss": 0.6848,
      "step": 13800
    },
    {
      "epoch": 8.7,
      "learning_rate": 0.00018839490711751198,
      "loss": 0.6901,
      "step": 13900
    },
    {
      "epoch": 8.77,
      "learning_rate": 0.00018735128365685656,
      "loss": 0.6994,
      "step": 14000
    },
    {
      "epoch": 8.83,
      "learning_rate": 0.0001863076601962012,
      "loss": 0.6739,
      "step": 14100
    },
    {
      "epoch": 8.89,
      "learning_rate": 0.0001852640367355458,
      "loss": 0.6854,
      "step": 14200
    },
    {
      "epoch": 8.95,
      "learning_rate": 0.00018422041327489038,
      "loss": 0.6416,
      "step": 14300
    },
    {
      "epoch": 9.0,
      "eval_accuracy": 0.9057075610473668,
      "eval_loss": 0.31237688660621643,
      "eval_runtime": 148.9632,
      "eval_samples_per_second": 45.635,
      "eval_steps_per_second": 0.718,
      "step": 14373
    },
    {
      "epoch": 9.02,
      "learning_rate": 0.00018317678981423502,
      "loss": 0.6711,
      "step": 14400
    },
    {
      "epoch": 9.08,
      "learning_rate": 0.0001821331663535796,
      "loss": 0.6965,
      "step": 14500
    },
    {
      "epoch": 9.14,
      "learning_rate": 0.00018108954289292422,
      "loss": 0.6896,
      "step": 14600
    },
    {
      "epoch": 9.2,
      "learning_rate": 0.00018004591943226883,
      "loss": 0.6944,
      "step": 14700
    },
    {
      "epoch": 9.27,
      "learning_rate": 0.00017900229597161342,
      "loss": 0.6981,
      "step": 14800
    },
    {
      "epoch": 9.33,
      "learning_rate": 0.00017795867251095803,
      "loss": 0.6819,
      "step": 14900
    },
    {
      "epoch": 9.39,
      "learning_rate": 0.00017691504905030265,
      "loss": 0.6869,
      "step": 15000
    },
    {
      "epoch": 9.46,
      "learning_rate": 0.00017587142558964723,
      "loss": 0.6974,
      "step": 15100
    },
    {
      "epoch": 9.52,
      "learning_rate": 0.00017482780212899185,
      "loss": 0.6621,
      "step": 15200
    },
    {
      "epoch": 9.58,
      "learning_rate": 0.00017378417866833646,
      "loss": 0.6732,
      "step": 15300
    },
    {
      "epoch": 9.64,
      "learning_rate": 0.00017274055520768105,
      "loss": 0.678,
      "step": 15400
    },
    {
      "epoch": 9.71,
      "learning_rate": 0.00017169693174702566,
      "loss": 0.6494,
      "step": 15500
    },
    {
      "epoch": 9.77,
      "learning_rate": 0.00017065330828637025,
      "loss": 0.6909,
      "step": 15600
    },
    {
      "epoch": 9.83,
      "learning_rate": 0.00016960968482571486,
      "loss": 0.687,
      "step": 15700
    },
    {
      "epoch": 9.89,
      "learning_rate": 0.00016856606136505948,
      "loss": 0.6705,
      "step": 15800
    },
    {
      "epoch": 9.96,
      "learning_rate": 0.00016752243790440406,
      "loss": 0.6698,
      "step": 15900
    },
    {
      "epoch": 10.0,
      "eval_accuracy": 0.8949691085613416,
      "eval_loss": 0.3288457989692688,
      "eval_runtime": 150.3856,
      "eval_samples_per_second": 45.204,
      "eval_steps_per_second": 0.712,
      "step": 15970
    },
    {
      "epoch": 10.02,
      "learning_rate": 0.00016648925067835524,
      "loss": 0.6701,
      "step": 16000
    },
    {
      "epoch": 10.08,
      "learning_rate": 0.00016544562721769983,
      "loss": 0.6771,
      "step": 16100
    },
    {
      "epoch": 10.14,
      "learning_rate": 0.00016440200375704444,
      "loss": 0.6877,
      "step": 16200
    },
    {
      "epoch": 10.21,
      "learning_rate": 0.00016335838029638906,
      "loss": 0.6495,
      "step": 16300
    },
    {
      "epoch": 10.27,
      "learning_rate": 0.00016231475683573364,
      "loss": 0.6925,
      "step": 16400
    },
    {
      "epoch": 10.33,
      "learning_rate": 0.00016127113337507826,
      "loss": 0.647,
      "step": 16500
    },
    {
      "epoch": 10.39,
      "learning_rate": 0.00016022750991442287,
      "loss": 0.658,
      "step": 16600
    },
    {
      "epoch": 10.46,
      "learning_rate": 0.00015918388645376746,
      "loss": 0.7033,
      "step": 16700
    },
    {
      "epoch": 10.52,
      "learning_rate": 0.00015814026299311207,
      "loss": 0.6675,
      "step": 16800
    },
    {
      "epoch": 10.58,
      "learning_rate": 0.00015709663953245666,
      "loss": 0.6905,
      "step": 16900
    },
    {
      "epoch": 10.64,
      "learning_rate": 0.0001560530160718013,
      "loss": 0.6766,
      "step": 17000
    },
    {
      "epoch": 10.71,
      "learning_rate": 0.00015500939261114588,
      "loss": 0.684,
      "step": 17100
    },
    {
      "epoch": 10.77,
      "learning_rate": 0.00015396576915049047,
      "loss": 0.6382,
      "step": 17200
    },
    {
      "epoch": 10.83,
      "learning_rate": 0.0001529221456898351,
      "loss": 0.6737,
      "step": 17300
    },
    {
      "epoch": 10.9,
      "learning_rate": 0.0001518785222291797,
      "loss": 0.691,
      "step": 17400
    },
    {
      "epoch": 10.96,
      "learning_rate": 0.00015083489876852429,
      "loss": 0.716,
      "step": 17500
    },
    {
      "epoch": 11.0,
      "eval_accuracy": 0.8998234774933804,
      "eval_loss": 0.31469690799713135,
      "eval_runtime": 150.5759,
      "eval_samples_per_second": 45.147,
      "eval_steps_per_second": 0.711,
      "step": 17567
    },
    {
      "epoch": 11.02,
      "learning_rate": 0.0001497912753078689,
      "loss": 0.7326,
      "step": 17600
    },
    {
      "epoch": 11.08,
      "learning_rate": 0.0001487476518472135,
      "loss": 0.6747,
      "step": 17700
    },
    {
      "epoch": 11.15,
      "learning_rate": 0.00014770402838655813,
      "loss": 0.7075,
      "step": 17800
    },
    {
      "epoch": 11.21,
      "learning_rate": 0.0001466604049259027,
      "loss": 0.69,
      "step": 17900
    },
    {
      "epoch": 11.27,
      "learning_rate": 0.00014561678146524733,
      "loss": 0.6793,
      "step": 18000
    },
    {
      "epoch": 11.33,
      "learning_rate": 0.00014457315800459194,
      "loss": 0.6782,
      "step": 18100
    },
    {
      "epoch": 11.4,
      "learning_rate": 0.00014352953454393655,
      "loss": 0.6532,
      "step": 18200
    },
    {
      "epoch": 11.46,
      "learning_rate": 0.00014249634731788768,
      "loss": 0.7053,
      "step": 18300
    },
    {
      "epoch": 11.52,
      "learning_rate": 0.0001414527238572323,
      "loss": 0.6476,
      "step": 18400
    },
    {
      "epoch": 11.58,
      "learning_rate": 0.0001404091003965769,
      "loss": 0.6308,
      "step": 18500
    },
    {
      "epoch": 11.65,
      "learning_rate": 0.0001393654769359215,
      "loss": 0.6886,
      "step": 18600
    },
    {
      "epoch": 11.71,
      "learning_rate": 0.0001383218534752661,
      "loss": 0.6631,
      "step": 18700
    },
    {
      "epoch": 11.77,
      "learning_rate": 0.00013727823001461072,
      "loss": 0.7056,
      "step": 18800
    },
    {
      "epoch": 11.83,
      "learning_rate": 0.00013623460655395533,
      "loss": 0.6602,
      "step": 18900
    },
    {
      "epoch": 11.9,
      "learning_rate": 0.00013519098309329992,
      "loss": 0.6728,
      "step": 19000
    },
    {
      "epoch": 11.96,
      "learning_rate": 0.00013414735963264453,
      "loss": 0.6514,
      "step": 19100
    },
    {
      "epoch": 12.0,
      "eval_accuracy": 0.9111503383348043,
      "eval_loss": 0.3034283220767975,
      "eval_runtime": 145.7542,
      "eval_samples_per_second": 46.64,
      "eval_steps_per_second": 0.734,
      "step": 19164
    },
    {
      "epoch": 12.02,
      "learning_rate": 0.00013310373617198915,
      "loss": 0.6567,
      "step": 19200
    },
    {
      "epoch": 12.09,
      "learning_rate": 0.00013206011271133373,
      "loss": 0.6882,
      "step": 19300
    },
    {
      "epoch": 12.15,
      "learning_rate": 0.00013101648925067835,
      "loss": 0.6511,
      "step": 19400
    },
    {
      "epoch": 12.21,
      "learning_rate": 0.00012997286579002296,
      "loss": 0.6705,
      "step": 19500
    },
    {
      "epoch": 12.27,
      "learning_rate": 0.00012892924232936755,
      "loss": 0.6693,
      "step": 19600
    },
    {
      "epoch": 12.34,
      "learning_rate": 0.00012788561886871216,
      "loss": 0.68,
      "step": 19700
    },
    {
      "epoch": 12.4,
      "learning_rate": 0.00012684199540805675,
      "loss": 0.6767,
      "step": 19800
    },
    {
      "epoch": 12.46,
      "learning_rate": 0.00012579837194740136,
      "loss": 0.6768,
      "step": 19900
    },
    {
      "epoch": 12.52,
      "learning_rate": 0.00012475474848674598,
      "loss": 0.6662,
      "step": 20000
    },
    {
      "epoch": 12.59,
      "learning_rate": 0.00012371112502609056,
      "loss": 0.6511,
      "step": 20100
    },
    {
      "epoch": 12.65,
      "learning_rate": 0.00012266750156543518,
      "loss": 0.7057,
      "step": 20200
    },
    {
      "epoch": 12.71,
      "learning_rate": 0.00012163431433938634,
      "loss": 0.6699,
      "step": 20300
    },
    {
      "epoch": 12.77,
      "learning_rate": 0.00012059069087873094,
      "loss": 0.6541,
      "step": 20400
    },
    {
      "epoch": 12.84,
      "learning_rate": 0.00011954706741807554,
      "loss": 0.6741,
      "step": 20500
    },
    {
      "epoch": 12.9,
      "learning_rate": 0.00011850344395742016,
      "loss": 0.658,
      "step": 20600
    },
    {
      "epoch": 12.96,
      "learning_rate": 0.00011745982049676476,
      "loss": 0.6513,
      "step": 20700
    },
    {
      "epoch": 13.0,
      "eval_accuracy": 0.9092380111797588,
      "eval_loss": 0.30905914306640625,
      "eval_runtime": 146.3169,
      "eval_samples_per_second": 46.461,
      "eval_steps_per_second": 0.731,
      "step": 20761
    },
    {
      "epoch": 13.02,
      "learning_rate": 0.00011641619703610936,
      "loss": 0.6568,
      "step": 20800
    },
    {
      "epoch": 13.09,
      "learning_rate": 0.00011537257357545397,
      "loss": 0.6853,
      "step": 20900
    },
    {
      "epoch": 13.15,
      "learning_rate": 0.00011432895011479858,
      "loss": 0.6699,
      "step": 21000
    },
    {
      "epoch": 13.21,
      "learning_rate": 0.00011328532665414317,
      "loss": 0.6494,
      "step": 21100
    },
    {
      "epoch": 13.27,
      "learning_rate": 0.00011224170319348778,
      "loss": 0.7118,
      "step": 21200
    },
    {
      "epoch": 13.34,
      "learning_rate": 0.00011119807973283239,
      "loss": 0.6649,
      "step": 21300
    },
    {
      "epoch": 13.4,
      "learning_rate": 0.00011015445627217699,
      "loss": 0.6646,
      "step": 21400
    },
    {
      "epoch": 13.46,
      "learning_rate": 0.0001091108328115216,
      "loss": 0.6436,
      "step": 21500
    },
    {
      "epoch": 13.53,
      "learning_rate": 0.0001080672093508662,
      "loss": 0.6258,
      "step": 21600
    },
    {
      "epoch": 13.59,
      "learning_rate": 0.0001070235858902108,
      "loss": 0.6754,
      "step": 21700
    },
    {
      "epoch": 13.65,
      "learning_rate": 0.0001059799624295554,
      "loss": 0.6737,
      "step": 21800
    },
    {
      "epoch": 13.71,
      "learning_rate": 0.00010493633896890001,
      "loss": 0.6511,
      "step": 21900
    },
    {
      "epoch": 13.78,
      "learning_rate": 0.00010389271550824463,
      "loss": 0.6472,
      "step": 22000
    },
    {
      "epoch": 13.84,
      "learning_rate": 0.00010284909204758921,
      "loss": 0.6571,
      "step": 22100
    },
    {
      "epoch": 13.9,
      "learning_rate": 0.00010180546858693383,
      "loss": 0.693,
      "step": 22200
    },
    {
      "epoch": 13.96,
      "learning_rate": 0.00010076184512627843,
      "loss": 0.652,
      "step": 22300
    },
    {
      "epoch": 14.0,
      "eval_accuracy": 0.909973521624007,
      "eval_loss": 0.30560359358787537,
      "eval_runtime": 146.3619,
      "eval_samples_per_second": 46.447,
      "eval_steps_per_second": 0.731,
      "step": 22358
    },
    {
      "epoch": 14.03,
      "learning_rate": 9.971822166562303e-05,
      "loss": 0.6286,
      "step": 22400
    },
    {
      "epoch": 14.09,
      "learning_rate": 9.867459820496764e-05,
      "loss": 0.6503,
      "step": 22500
    },
    {
      "epoch": 14.15,
      "learning_rate": 9.763097474431224e-05,
      "loss": 0.6514,
      "step": 22600
    },
    {
      "epoch": 14.21,
      "learning_rate": 9.659778751826341e-05,
      "loss": 0.6728,
      "step": 22700
    },
    {
      "epoch": 14.28,
      "learning_rate": 9.555416405760801e-05,
      "loss": 0.6621,
      "step": 22800
    },
    {
      "epoch": 14.34,
      "learning_rate": 9.451054059695261e-05,
      "loss": 0.6771,
      "step": 22900
    },
    {
      "epoch": 14.4,
      "learning_rate": 9.346691713629722e-05,
      "loss": 0.6689,
      "step": 23000
    },
    {
      "epoch": 14.46,
      "learning_rate": 9.242329367564181e-05,
      "loss": 0.6712,
      "step": 23100
    },
    {
      "epoch": 14.53,
      "learning_rate": 9.137967021498642e-05,
      "loss": 0.6761,
      "step": 23200
    },
    {
      "epoch": 14.59,
      "learning_rate": 9.033604675433104e-05,
      "loss": 0.6327,
      "step": 23300
    },
    {
      "epoch": 14.65,
      "learning_rate": 8.929242329367564e-05,
      "loss": 0.6671,
      "step": 23400
    },
    {
      "epoch": 14.72,
      "learning_rate": 8.824879983302024e-05,
      "loss": 0.6598,
      "step": 23500
    },
    {
      "epoch": 14.78,
      "learning_rate": 8.720517637236485e-05,
      "loss": 0.6317,
      "step": 23600
    },
    {
      "epoch": 14.84,
      "learning_rate": 8.616155291170945e-05,
      "loss": 0.6615,
      "step": 23700
    },
    {
      "epoch": 14.9,
      "learning_rate": 8.511792945105405e-05,
      "loss": 0.6087,
      "step": 23800
    },
    {
      "epoch": 14.97,
      "learning_rate": 8.407430599039865e-05,
      "loss": 0.7105,
      "step": 23900
    },
    {
      "epoch": 15.0,
      "eval_accuracy": 0.9149749926448956,
      "eval_loss": 0.30149412155151367,
      "eval_runtime": 145.6909,
      "eval_samples_per_second": 46.66,
      "eval_steps_per_second": 0.734,
      "step": 23955
    },
    {
      "epoch": 15.03,
      "learning_rate": 8.303068252974326e-05,
      "loss": 0.6911,
      "step": 24000
    },
    {
      "epoch": 15.09,
      "learning_rate": 8.198705906908788e-05,
      "loss": 0.6717,
      "step": 24100
    },
    {
      "epoch": 15.15,
      "learning_rate": 8.094343560843246e-05,
      "loss": 0.6564,
      "step": 24200
    },
    {
      "epoch": 15.22,
      "learning_rate": 7.989981214777708e-05,
      "loss": 0.6446,
      "step": 24300
    },
    {
      "epoch": 15.28,
      "learning_rate": 7.885618868712169e-05,
      "loss": 0.6431,
      "step": 24400
    },
    {
      "epoch": 15.34,
      "learning_rate": 7.781256522646628e-05,
      "loss": 0.6762,
      "step": 24500
    },
    {
      "epoch": 15.4,
      "learning_rate": 7.676894176581089e-05,
      "loss": 0.6656,
      "step": 24600
    },
    {
      "epoch": 15.47,
      "learning_rate": 7.572531830515549e-05,
      "loss": 0.6337,
      "step": 24700
    },
    {
      "epoch": 15.53,
      "learning_rate": 7.468169484450009e-05,
      "loss": 0.6541,
      "step": 24800
    },
    {
      "epoch": 15.59,
      "learning_rate": 7.363807138384469e-05,
      "loss": 0.6772,
      "step": 24900
    },
    {
      "epoch": 15.65,
      "learning_rate": 7.260488415779586e-05,
      "loss": 0.629,
      "step": 25000
    },
    {
      "epoch": 15.72,
      "learning_rate": 7.156126069714046e-05,
      "loss": 0.6998,
      "step": 25100
    },
    {
      "epoch": 15.78,
      "learning_rate": 7.051763723648507e-05,
      "loss": 0.6686,
      "step": 25200
    },
    {
      "epoch": 15.84,
      "learning_rate": 6.947401377582967e-05,
      "loss": 0.6822,
      "step": 25300
    },
    {
      "epoch": 15.9,
      "learning_rate": 6.843039031517429e-05,
      "loss": 0.6143,
      "step": 25400
    },
    {
      "epoch": 15.97,
      "learning_rate": 6.738676685451889e-05,
      "loss": 0.6337,
      "step": 25500
    },
    {
      "epoch": 16.0,
      "eval_accuracy": 0.9090909090909091,
      "eval_loss": 0.30700910091400146,
      "eval_runtime": 146.384,
      "eval_samples_per_second": 46.44,
      "eval_steps_per_second": 0.731,
      "step": 25552
    },
    {
      "epoch": 16.03,
      "learning_rate": 6.634314339386349e-05,
      "loss": 0.6502,
      "step": 25600
    },
    {
      "epoch": 16.09,
      "learning_rate": 6.52995199332081e-05,
      "loss": 0.6448,
      "step": 25700
    },
    {
      "epoch": 16.16,
      "learning_rate": 6.42558964725527e-05,
      "loss": 0.6272,
      "step": 25800
    },
    {
      "epoch": 16.22,
      "learning_rate": 6.32122730118973e-05,
      "loss": 0.6316,
      "step": 25900
    },
    {
      "epoch": 16.28,
      "learning_rate": 6.21686495512419e-05,
      "loss": 0.6442,
      "step": 26000
    },
    {
      "epoch": 16.34,
      "learning_rate": 6.11250260905865e-05,
      "loss": 0.6489,
      "step": 26100
    },
    {
      "epoch": 16.41,
      "learning_rate": 6.0081402629931114e-05,
      "loss": 0.6603,
      "step": 26200
    },
    {
      "epoch": 16.47,
      "learning_rate": 5.9037779169275714e-05,
      "loss": 0.6449,
      "step": 26300
    },
    {
      "epoch": 16.53,
      "learning_rate": 5.799415570862033e-05,
      "loss": 0.661,
      "step": 26400
    },
    {
      "epoch": 16.59,
      "learning_rate": 5.695053224796493e-05,
      "loss": 0.642,
      "step": 26500
    },
    {
      "epoch": 16.66,
      "learning_rate": 5.5906908787309535e-05,
      "loss": 0.6498,
      "step": 26600
    },
    {
      "epoch": 16.72,
      "learning_rate": 5.4863285326654135e-05,
      "loss": 0.6902,
      "step": 26700
    },
    {
      "epoch": 16.78,
      "learning_rate": 5.381966186599874e-05,
      "loss": 0.6336,
      "step": 26800
    },
    {
      "epoch": 16.84,
      "learning_rate": 5.277603840534335e-05,
      "loss": 0.6393,
      "step": 26900
    },
    {
      "epoch": 16.91,
      "learning_rate": 5.173241494468795e-05,
      "loss": 0.6496,
      "step": 27000
    },
    {
      "epoch": 16.97,
      "learning_rate": 5.0688791484032557e-05,
      "loss": 0.63,
      "step": 27100
    },
    {
      "epoch": 17.0,
      "eval_accuracy": 0.913503971756399,
      "eval_loss": 0.30175167322158813,
      "eval_runtime": 149.8031,
      "eval_samples_per_second": 45.38,
      "eval_steps_per_second": 0.714,
      "step": 27149
    },
    {
      "epoch": 17.03,
      "learning_rate": 4.9645168023377163e-05,
      "loss": 0.6195,
      "step": 27200
    },
    {
      "epoch": 17.09,
      "learning_rate": 4.861198079732832e-05,
      "loss": 0.6299,
      "step": 27300
    },
    {
      "epoch": 17.16,
      "learning_rate": 4.756835733667292e-05,
      "loss": 0.6939,
      "step": 27400
    },
    {
      "epoch": 17.22,
      "learning_rate": 4.652473387601752e-05,
      "loss": 0.6416,
      "step": 27500
    },
    {
      "epoch": 17.28,
      "learning_rate": 4.5481110415362136e-05,
      "loss": 0.6626,
      "step": 27600
    },
    {
      "epoch": 17.35,
      "learning_rate": 4.4437486954706736e-05,
      "loss": 0.6444,
      "step": 27700
    },
    {
      "epoch": 17.41,
      "learning_rate": 4.339386349405134e-05,
      "loss": 0.6238,
      "step": 27800
    },
    {
      "epoch": 17.47,
      "learning_rate": 4.2350240033395944e-05,
      "loss": 0.6505,
      "step": 27900
    },
    {
      "epoch": 17.53,
      "learning_rate": 4.130661657274056e-05,
      "loss": 0.6346,
      "step": 28000
    },
    {
      "epoch": 17.6,
      "learning_rate": 4.026299311208516e-05,
      "loss": 0.6319,
      "step": 28100
    },
    {
      "epoch": 17.66,
      "learning_rate": 3.921936965142976e-05,
      "loss": 0.6811,
      "step": 28200
    },
    {
      "epoch": 17.72,
      "learning_rate": 3.8175746190774365e-05,
      "loss": 0.6645,
      "step": 28300
    },
    {
      "epoch": 17.78,
      "learning_rate": 3.713212273011897e-05,
      "loss": 0.6512,
      "step": 28400
    },
    {
      "epoch": 17.85,
      "learning_rate": 3.608849926946357e-05,
      "loss": 0.6578,
      "step": 28500
    },
    {
      "epoch": 17.91,
      "learning_rate": 3.504487580880818e-05,
      "loss": 0.6358,
      "step": 28600
    },
    {
      "epoch": 17.97,
      "learning_rate": 3.4001252348152786e-05,
      "loss": 0.6672,
      "step": 28700
    },
    {
      "epoch": 18.0,
      "eval_accuracy": 0.9087967049132097,
      "eval_loss": 0.30836355686187744,
      "eval_runtime": 148.2197,
      "eval_samples_per_second": 45.864,
      "eval_steps_per_second": 0.722,
      "step": 28746
    },
    {
      "epoch": 18.03,
      "learning_rate": 3.295762888749739e-05,
      "loss": 0.65,
      "step": 28800
    },
    {
      "epoch": 18.1,
      "learning_rate": 3.191400542684199e-05,
      "loss": 0.6293,
      "step": 28900
    },
    {
      "epoch": 18.16,
      "learning_rate": 3.087038196618659e-05,
      "loss": 0.6059,
      "step": 29000
    },
    {
      "epoch": 18.22,
      "learning_rate": 2.98267585055312e-05,
      "loss": 0.5975,
      "step": 29100
    },
    {
      "epoch": 18.28,
      "learning_rate": 2.8783135044875807e-05,
      "loss": 0.6759,
      "step": 29200
    },
    {
      "epoch": 18.35,
      "learning_rate": 2.773951158422041e-05,
      "loss": 0.6457,
      "step": 29300
    },
    {
      "epoch": 18.41,
      "learning_rate": 2.6695888123565017e-05,
      "loss": 0.6715,
      "step": 29400
    },
    {
      "epoch": 18.47,
      "learning_rate": 2.565226466290962e-05,
      "loss": 0.6642,
      "step": 29500
    },
    {
      "epoch": 18.53,
      "learning_rate": 2.460864120225422e-05,
      "loss": 0.6432,
      "step": 29600
    },
    {
      "epoch": 18.6,
      "learning_rate": 2.3565017741598828e-05,
      "loss": 0.6441,
      "step": 29700
    },
    {
      "epoch": 18.66,
      "learning_rate": 2.2521394280943432e-05,
      "loss": 0.6843,
      "step": 29800
    },
    {
      "epoch": 18.72,
      "learning_rate": 2.147777082028804e-05,
      "loss": 0.6459,
      "step": 29900
    },
    {
      "epoch": 18.79,
      "learning_rate": 2.0434147359632642e-05,
      "loss": 0.6233,
      "step": 30000
    },
    {
      "epoch": 18.85,
      "learning_rate": 1.939052389897725e-05,
      "loss": 0.6634,
      "step": 30100
    },
    {
      "epoch": 18.91,
      "learning_rate": 1.8346900438321853e-05,
      "loss": 0.6701,
      "step": 30200
    },
    {
      "epoch": 18.97,
      "learning_rate": 1.7303276977666456e-05,
      "loss": 0.6479,
      "step": 30300
    },
    {
      "epoch": 19.0,
      "eval_accuracy": 0.9101206237128567,
      "eval_loss": 0.3060016632080078,
      "eval_runtime": 149.555,
      "eval_samples_per_second": 45.455,
      "eval_steps_per_second": 0.715,
      "step": 30343
    },
    {
      "epoch": 19.04,
      "learning_rate": 1.625965351701106e-05,
      "loss": 0.6155,
      "step": 30400
    },
    {
      "epoch": 19.1,
      "learning_rate": 1.5216030056355665e-05,
      "loss": 0.6079,
      "step": 30500
    },
    {
      "epoch": 19.16,
      "learning_rate": 1.417240659570027e-05,
      "loss": 0.6709,
      "step": 30600
    },
    {
      "epoch": 19.22,
      "learning_rate": 1.3128783135044874e-05,
      "loss": 0.6604,
      "step": 30700
    },
    {
      "epoch": 19.29,
      "learning_rate": 1.208515967438948e-05,
      "loss": 0.6222,
      "step": 30800
    },
    {
      "epoch": 19.35,
      "learning_rate": 1.1041536213734085e-05,
      "loss": 0.6428,
      "step": 30900
    },
    {
      "epoch": 19.41,
      "learning_rate": 9.997912753078688e-06,
      "loss": 0.6664,
      "step": 31000
    },
    {
      "epoch": 19.47,
      "learning_rate": 8.954289292423293e-06,
      "loss": 0.6489,
      "step": 31100
    },
    {
      "epoch": 19.54,
      "learning_rate": 7.910665831767897e-06,
      "loss": 0.6414,
      "step": 31200
    },
    {
      "epoch": 19.6,
      "learning_rate": 6.877478605719056e-06,
      "loss": 0.6599,
      "step": 31300
    },
    {
      "epoch": 19.66,
      "learning_rate": 5.83385514506366e-06,
      "loss": 0.6433,
      "step": 31400
    },
    {
      "epoch": 19.72,
      "learning_rate": 4.790231684408265e-06,
      "loss": 0.6325,
      "step": 31500
    },
    {
      "epoch": 19.79,
      "learning_rate": 3.7466082237528697e-06,
      "loss": 0.6363,
      "step": 31600
    },
    {
      "epoch": 19.85,
      "learning_rate": 2.7029847630974745e-06,
      "loss": 0.6408,
      "step": 31700
    },
    {
      "epoch": 19.91,
      "learning_rate": 1.6593613024420787e-06,
      "loss": 0.645,
      "step": 31800
    },
    {
      "epoch": 19.97,
      "learning_rate": 6.157378417866834e-07,
      "loss": 0.6658,
      "step": 31900
    },
    {
      "epoch": 20.0,
      "eval_accuracy": 0.9089438070020595,
      "eval_loss": 0.3071773946285248,
      "eval_runtime": 150.0563,
      "eval_samples_per_second": 45.303,
      "eval_steps_per_second": 0.713,
      "step": 31940
    },
    {
      "epoch": 20.0,
      "step": 31940,
      "total_flos": 0.0,
      "train_loss": 0.8136612295581911,
      "train_runtime": 27726.7705,
      "train_samples_per_second": 36.855,
      "train_steps_per_second": 1.152
    }
  ],
  "max_steps": 31940,
  "num_train_epochs": 20,
  "total_flos": 0.0,
  "trial_name": null,
  "trial_params": null
}