{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 7.65345170671973,
  "eval_steps": 1000,
  "global_step": 200000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.019133629266799325,
      "grad_norm": 3.534731864929199,
      "learning_rate": 0.0002982,
      "loss": 2.0385,
      "step": 500
    },
    {
      "epoch": 0.03826725853359865,
      "grad_norm": 3.997960090637207,
      "learning_rate": 0.00029925413533834583,
      "loss": 1.5221,
      "step": 1000
    },
    {
      "epoch": 0.03826725853359865,
      "eval_loss": Infinity,
      "eval_runtime": 316.3189,
      "eval_samples_per_second": 22.199,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.9139914321980114,
      "step": 1000
    },
    {
      "epoch": 0.05740088780039798,
      "grad_norm": 2.7378287315368652,
      "learning_rate": 0.0002985022556390977,
      "loss": 1.4633,
      "step": 1500
    },
    {
      "epoch": 0.0765345170671973,
      "grad_norm": 3.522592782974243,
      "learning_rate": 0.0002977503759398496,
      "loss": 1.4078,
      "step": 2000
    },
    {
      "epoch": 0.0765345170671973,
      "eval_loss": Infinity,
      "eval_runtime": 316.2822,
      "eval_samples_per_second": 22.202,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.9065607150412524,
      "step": 2000
    },
    {
      "epoch": 0.09566814633399663,
      "grad_norm": 8.136958122253418,
      "learning_rate": 0.0002969984962406015,
      "loss": 1.3589,
      "step": 2500
    },
    {
      "epoch": 0.11480177560079596,
      "grad_norm": 2.9784021377563477,
      "learning_rate": 0.00029624661654135335,
      "loss": 1.336,
      "step": 3000
    },
    {
      "epoch": 0.11480177560079596,
      "eval_loss": Infinity,
      "eval_runtime": 315.7333,
      "eval_samples_per_second": 22.24,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.8949386503067485,
      "step": 3000
    },
    {
      "epoch": 0.13393540486759528,
      "grad_norm": 3.5435404777526855,
      "learning_rate": 0.0002954947368421052,
      "loss": 1.3258,
      "step": 3500
    },
    {
      "epoch": 0.1530690341343946,
      "grad_norm": 2.8903892040252686,
      "learning_rate": 0.0002947443609022556,
      "loss": 1.2887,
      "step": 4000
    },
    {
      "epoch": 0.1530690341343946,
      "eval_loss": Infinity,
      "eval_runtime": 316.2047,
      "eval_samples_per_second": 22.207,
      "eval_steps_per_second": 2.777,
      "eval_wer": 0.8745901205838799,
      "step": 4000
    },
    {
      "epoch": 0.17220266340119394,
      "grad_norm": 2.647843360900879,
      "learning_rate": 0.000293993984962406,
      "loss": 1.2713,
      "step": 4500
    },
    {
      "epoch": 0.19133629266799326,
      "grad_norm": 3.8844950199127197,
      "learning_rate": 0.00029324210526315787,
      "loss": 1.26,
      "step": 5000
    },
    {
      "epoch": 0.19133629266799326,
      "eval_loss": Infinity,
      "eval_runtime": 315.2217,
      "eval_samples_per_second": 22.276,
      "eval_steps_per_second": 2.785,
      "eval_wer": 0.8671197376771737,
      "step": 5000
    },
    {
      "epoch": 0.21046992193479258,
      "grad_norm": 3.8498334884643555,
      "learning_rate": 0.00029249022556390974,
      "loss": 1.231,
      "step": 5500
    },
    {
      "epoch": 0.22960355120159193,
      "grad_norm": 2.3221595287323,
      "learning_rate": 0.0002917383458646616,
      "loss": 1.2188,
      "step": 6000
    },
    {
      "epoch": 0.22960355120159193,
      "eval_loss": Infinity,
      "eval_runtime": 315.8377,
      "eval_samples_per_second": 22.233,
      "eval_steps_per_second": 2.78,
      "eval_wer": 0.8699756716733658,
      "step": 6000
    },
    {
      "epoch": 0.24873718046839124,
      "grad_norm": 2.9522998332977295,
      "learning_rate": 0.00029098646616541353,
      "loss": 1.1974,
      "step": 6500
    },
    {
      "epoch": 0.26787080973519056,
      "grad_norm": 5.0502214431762695,
      "learning_rate": 0.0002902345864661654,
      "loss": 1.1992,
      "step": 7000
    },
    {
      "epoch": 0.26787080973519056,
      "eval_loss": Infinity,
      "eval_runtime": 315.6699,
      "eval_samples_per_second": 22.245,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.8537920456949439,
      "step": 7000
    },
    {
      "epoch": 0.2870044390019899,
      "grad_norm": 3.480316400527954,
      "learning_rate": 0.00028948270676691727,
      "loss": 1.1786,
      "step": 7500
    },
    {
      "epoch": 0.3061380682687892,
      "grad_norm": 3.4583587646484375,
      "learning_rate": 0.00028873082706766913,
      "loss": 1.1773,
      "step": 8000
    },
    {
      "epoch": 0.3061380682687892,
      "eval_loss": Infinity,
      "eval_runtime": 315.6868,
      "eval_samples_per_second": 22.244,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.8329278612227629,
      "step": 8000
    },
    {
      "epoch": 0.32527169753558854,
      "grad_norm": 3.2121310234069824,
      "learning_rate": 0.00028797894736842106,
      "loss": 1.1475,
      "step": 8500
    },
    {
      "epoch": 0.3444053268023879,
      "grad_norm": 6.1687846183776855,
      "learning_rate": 0.0002872285714285714,
      "loss": 1.1602,
      "step": 9000
    },
    {
      "epoch": 0.3444053268023879,
      "eval_loss": Infinity,
      "eval_runtime": 315.9185,
      "eval_samples_per_second": 22.227,
      "eval_steps_per_second": 2.779,
      "eval_wer": 0.8200497144066003,
      "step": 9000
    },
    {
      "epoch": 0.3635389560691872,
      "grad_norm": 2.9368505477905273,
      "learning_rate": 0.0002864766917293233,
      "loss": 1.1233,
      "step": 9500
    },
    {
      "epoch": 0.3826725853359865,
      "grad_norm": 2.0912511348724365,
      "learning_rate": 0.00028572481203007513,
      "loss": 1.1128,
      "step": 10000
    },
    {
      "epoch": 0.3826725853359865,
      "eval_loss": Infinity,
      "eval_runtime": 316.2709,
      "eval_samples_per_second": 22.202,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.8059287074254284,
      "step": 10000
    },
    {
      "epoch": 0.40180621460278587,
      "grad_norm": 2.822795867919922,
      "learning_rate": 0.00028497293233082705,
      "loss": 1.096,
      "step": 10500
    },
    {
      "epoch": 0.42093984386958516,
      "grad_norm": 2.4663002490997314,
      "learning_rate": 0.0002842210526315789,
      "loss": 1.0893,
      "step": 11000
    },
    {
      "epoch": 0.42093984386958516,
      "eval_loss": Infinity,
      "eval_runtime": 317.2266,
      "eval_samples_per_second": 22.136,
      "eval_steps_per_second": 2.768,
      "eval_wer": 0.827678760313095,
      "step": 11000
    },
    {
      "epoch": 0.4400734731363845,
      "grad_norm": 1.9610426425933838,
      "learning_rate": 0.0002834691729323308,
      "loss": 1.0702,
      "step": 11500
    },
    {
      "epoch": 0.45920710240318385,
      "grad_norm": 3.893796682357788,
      "learning_rate": 0.00028271729323308266,
      "loss": 1.0809,
      "step": 12000
    },
    {
      "epoch": 0.45920710240318385,
      "eval_loss": Infinity,
      "eval_runtime": 316.2707,
      "eval_samples_per_second": 22.202,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.8028480008462027,
      "step": 12000
    },
    {
      "epoch": 0.47834073166998314,
      "grad_norm": 3.08317494392395,
      "learning_rate": 0.0002819669172932331,
      "loss": 1.0616,
      "step": 12500
    },
    {
      "epoch": 0.4974743609367825,
      "grad_norm": 1.9941602945327759,
      "learning_rate": 0.0002812150375939849,
      "loss": 1.0426,
      "step": 13000
    },
    {
      "epoch": 0.4974743609367825,
      "eval_loss": Infinity,
      "eval_runtime": 314.9265,
      "eval_samples_per_second": 22.297,
      "eval_steps_per_second": 2.788,
      "eval_wer": 0.8004416120160779,
      "step": 13000
    },
    {
      "epoch": 0.5166079902035818,
      "grad_norm": 2.075686454772949,
      "learning_rate": 0.0002804646616541353,
      "loss": 1.0316,
      "step": 13500
    },
    {
      "epoch": 0.5357416194703811,
      "grad_norm": 1.7053288221359253,
      "learning_rate": 0.0002797127819548872,
      "loss": 1.0202,
      "step": 14000
    },
    {
      "epoch": 0.5357416194703811,
      "eval_loss": Infinity,
      "eval_runtime": 315.6762,
      "eval_samples_per_second": 22.244,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.7824598053733869,
      "step": 14000
    },
    {
      "epoch": 0.5548752487371804,
      "grad_norm": 2.8614988327026367,
      "learning_rate": 0.00027896240601503757,
      "loss": 1.0398,
      "step": 14500
    },
    {
      "epoch": 0.5740088780039798,
      "grad_norm": 2.7677505016326904,
      "learning_rate": 0.0002782105263157895,
      "loss": 1.0005,
      "step": 15000
    },
    {
      "epoch": 0.5740088780039798,
      "eval_loss": Infinity,
      "eval_runtime": 316.6237,
      "eval_samples_per_second": 22.178,
      "eval_steps_per_second": 2.773,
      "eval_wer": 0.7785725618785699,
      "step": 15000
    },
    {
      "epoch": 0.5931425072707791,
      "grad_norm": 1.8297598361968994,
      "learning_rate": 0.0002774586466165413,
      "loss": 1.0069,
      "step": 15500
    },
    {
      "epoch": 0.6122761365375784,
      "grad_norm": 3.259901285171509,
      "learning_rate": 0.0002767067669172932,
      "loss": 0.9987,
      "step": 16000
    },
    {
      "epoch": 0.6122761365375784,
      "eval_loss": Infinity,
      "eval_runtime": 317.076,
      "eval_samples_per_second": 22.146,
      "eval_steps_per_second": 2.769,
      "eval_wer": 0.752102284747197,
      "step": 16000
    },
    {
      "epoch": 0.6314097658043778,
      "grad_norm": 2.1204450130462646,
      "learning_rate": 0.0002759548872180451,
      "loss": 0.9862,
      "step": 16500
    },
    {
      "epoch": 0.6505433950711771,
      "grad_norm": 4.308948993682861,
      "learning_rate": 0.00027520300751879696,
      "loss": 0.9705,
      "step": 17000
    },
    {
      "epoch": 0.6505433950711771,
      "eval_loss": Infinity,
      "eval_runtime": 316.4489,
      "eval_samples_per_second": 22.19,
      "eval_steps_per_second": 2.775,
      "eval_wer": 0.7592817854876243,
      "step": 17000
    },
    {
      "epoch": 0.6696770243379764,
      "grad_norm": 3.809417247772217,
      "learning_rate": 0.00027445112781954883,
      "loss": 0.9836,
      "step": 17500
    },
    {
      "epoch": 0.6888106536047758,
      "grad_norm": 8.3826904296875,
      "learning_rate": 0.00027369924812030075,
      "loss": 0.9884,
      "step": 18000
    },
    {
      "epoch": 0.6888106536047758,
      "eval_loss": Infinity,
      "eval_runtime": 317.2775,
      "eval_samples_per_second": 22.132,
      "eval_steps_per_second": 2.767,
      "eval_wer": 0.7380606092659192,
      "step": 18000
    },
    {
      "epoch": 0.7079442828715751,
      "grad_norm": 2.119809627532959,
      "learning_rate": 0.0002729473684210526,
      "loss": 0.9554,
      "step": 18500
    },
    {
      "epoch": 0.7270779121383744,
      "grad_norm": 2.714183807373047,
      "learning_rate": 0.0002721954887218045,
      "loss": 0.9618,
      "step": 19000
    },
    {
      "epoch": 0.7270779121383744,
      "eval_loss": Infinity,
      "eval_runtime": 316.8028,
      "eval_samples_per_second": 22.165,
      "eval_steps_per_second": 2.771,
      "eval_wer": 0.7364739792680347,
      "step": 19000
    },
    {
      "epoch": 0.7462115414051738,
      "grad_norm": 4.593650817871094,
      "learning_rate": 0.00027144360902255635,
      "loss": 0.9389,
      "step": 19500
    },
    {
      "epoch": 0.765345170671973,
      "grad_norm": 1.7419074773788452,
      "learning_rate": 0.0002706917293233083,
      "loss": 0.9374,
      "step": 20000
    },
    {
      "epoch": 0.765345170671973,
      "eval_loss": Infinity,
      "eval_runtime": 316.3558,
      "eval_samples_per_second": 22.197,
      "eval_steps_per_second": 2.775,
      "eval_wer": 0.7415644171779141,
      "step": 20000
    },
    {
      "epoch": 0.7844787999387723,
      "grad_norm": NaN,
      "learning_rate": 0.0002699413533834586,
      "loss": 0.9241,
      "step": 20500
    },
    {
      "epoch": 0.8036124292055717,
      "grad_norm": 2.104843854904175,
      "learning_rate": 0.0002691894736842105,
      "loss": 0.9175,
      "step": 21000
    },
    {
      "epoch": 0.8036124292055717,
      "eval_loss": Infinity,
      "eval_runtime": 315.3422,
      "eval_samples_per_second": 22.268,
      "eval_steps_per_second": 2.784,
      "eval_wer": 0.7299291305267611,
      "step": 21000
    },
    {
      "epoch": 0.822746058472371,
      "grad_norm": 3.1283345222473145,
      "learning_rate": 0.0002684390977443609,
      "loss": 0.9193,
      "step": 21500
    },
    {
      "epoch": 0.8418796877391703,
      "grad_norm": 3.1702754497528076,
      "learning_rate": 0.00026768721804511274,
      "loss": 0.9247,
      "step": 22000
    },
    {
      "epoch": 0.8418796877391703,
      "eval_loss": Infinity,
      "eval_runtime": 316.0504,
      "eval_samples_per_second": 22.218,
      "eval_steps_per_second": 2.778,
      "eval_wer": 0.7260154431986461,
      "step": 22000
    },
    {
      "epoch": 0.8610133170059697,
      "grad_norm": 4.537879943847656,
      "learning_rate": 0.00026693533834586466,
      "loss": 0.9154,
      "step": 22500
    },
    {
      "epoch": 0.880146946272769,
      "grad_norm": 3.9466328620910645,
      "learning_rate": 0.00026618345864661653,
      "loss": 0.9001,
      "step": 23000
    },
    {
      "epoch": 0.880146946272769,
      "eval_loss": Infinity,
      "eval_runtime": 315.881,
      "eval_samples_per_second": 22.23,
      "eval_steps_per_second": 2.78,
      "eval_wer": 0.72349005711868,
      "step": 23000
    },
    {
      "epoch": 0.8992805755395683,
      "grad_norm": 5.256113052368164,
      "learning_rate": 0.0002654315789473684,
      "loss": 0.9027,
      "step": 23500
    },
    {
      "epoch": 0.9184142048063677,
      "grad_norm": 2.1492791175842285,
      "learning_rate": 0.00026467969924812027,
      "loss": 0.8836,
      "step": 24000
    },
    {
      "epoch": 0.9184142048063677,
      "eval_loss": Infinity,
      "eval_runtime": 315.4361,
      "eval_samples_per_second": 22.261,
      "eval_steps_per_second": 2.783,
      "eval_wer": 0.7085757351385656,
      "step": 24000
    },
    {
      "epoch": 0.937547834073167,
      "grad_norm": 3.541306734085083,
      "learning_rate": 0.0002639278195488722,
      "loss": 0.8782,
      "step": 24500
    },
    {
      "epoch": 0.9566814633399663,
      "grad_norm": 1.7392828464508057,
      "learning_rate": 0.000263175939849624,
      "loss": 0.8789,
      "step": 25000
    },
    {
      "epoch": 0.9566814633399663,
      "eval_loss": Infinity,
      "eval_runtime": 316.1779,
      "eval_samples_per_second": 22.209,
      "eval_steps_per_second": 2.777,
      "eval_wer": 0.7144859318806854,
      "step": 25000
    },
    {
      "epoch": 0.9758150926067657,
      "grad_norm": 2.769277572631836,
      "learning_rate": 0.0002624240601503759,
      "loss": 0.8776,
      "step": 25500
    },
    {
      "epoch": 0.994948721873565,
      "grad_norm": 3.246126413345337,
      "learning_rate": 0.0002616721804511278,
      "loss": 0.8734,
      "step": 26000
    },
    {
      "epoch": 0.994948721873565,
      "eval_loss": Infinity,
      "eval_runtime": 315.5548,
      "eval_samples_per_second": 22.253,
      "eval_steps_per_second": 2.782,
      "eval_wer": 0.7195102602073197,
      "step": 26000
    },
    {
      "epoch": 1.0140823511403643,
      "grad_norm": 1.4256001710891724,
      "learning_rate": 0.00026092030075187966,
      "loss": 0.8471,
      "step": 26500
    },
    {
      "epoch": 1.0332159804071637,
      "grad_norm": 1.2950644493103027,
      "learning_rate": 0.00026016992481203005,
      "loss": 0.8398,
      "step": 27000
    },
    {
      "epoch": 1.0332159804071637,
      "eval_loss": Infinity,
      "eval_runtime": 314.7022,
      "eval_samples_per_second": 22.313,
      "eval_steps_per_second": 2.79,
      "eval_wer": 0.6837978633382695,
      "step": 27000
    },
    {
      "epoch": 1.0523496096739628,
      "grad_norm": 0.8874345421791077,
      "learning_rate": 0.0002594180451127819,
      "loss": 0.8403,
      "step": 27500
    },
    {
      "epoch": 1.0714832389407623,
      "grad_norm": 1.146148920059204,
      "learning_rate": 0.0002586661654135338,
      "loss": 0.8268,
      "step": 28000
    },
    {
      "epoch": 1.0714832389407623,
      "eval_loss": Infinity,
      "eval_runtime": 313.7884,
      "eval_samples_per_second": 22.378,
      "eval_steps_per_second": 2.798,
      "eval_wer": 0.6793288555108948,
      "step": 28000
    },
    {
      "epoch": 1.0906168682075617,
      "grad_norm": 0.687147319316864,
      "learning_rate": 0.0002579142857142857,
      "loss": 0.8228,
      "step": 28500
    },
    {
      "epoch": 1.1097504974743608,
      "grad_norm": 0.614025890827179,
      "learning_rate": 0.00025716390977443605,
      "loss": 0.8196,
      "step": 29000
    },
    {
      "epoch": 1.1097504974743608,
      "eval_loss": Infinity,
      "eval_runtime": 315.3179,
      "eval_samples_per_second": 22.27,
      "eval_steps_per_second": 2.784,
      "eval_wer": 0.66387243494817,
      "step": 29000
    },
    {
      "epoch": 1.1288841267411602,
      "grad_norm": 0.7900418043136597,
      "learning_rate": 0.0002564120300751879,
      "loss": 0.8262,
      "step": 29500
    },
    {
      "epoch": 1.1480177560079596,
      "grad_norm": 0.9414839148521423,
      "learning_rate": 0.00025566015037593984,
      "loss": 0.8124,
      "step": 30000
    },
    {
      "epoch": 1.1480177560079596,
      "eval_loss": Infinity,
      "eval_runtime": 314.1972,
      "eval_samples_per_second": 22.349,
      "eval_steps_per_second": 2.794,
      "eval_wer": 0.6615453776179395,
      "step": 30000
    },
    {
      "epoch": 1.1671513852747588,
      "grad_norm": 0.9619298577308655,
      "learning_rate": 0.0002549082706766917,
      "loss": 0.8052,
      "step": 30500
    },
    {
      "epoch": 1.1862850145415582,
      "grad_norm": 1.3762531280517578,
      "learning_rate": 0.0002541563909774436,
      "loss": 0.7935,
      "step": 31000
    },
    {
      "epoch": 1.1862850145415582,
      "eval_loss": Infinity,
      "eval_runtime": 315.3254,
      "eval_samples_per_second": 22.269,
      "eval_steps_per_second": 2.784,
      "eval_wer": 0.6607520626189972,
      "step": 31000
    },
    {
      "epoch": 1.2054186438083576,
      "grad_norm": 1.0670289993286133,
      "learning_rate": 0.00025340451127819544,
      "loss": 0.799,
      "step": 31500
    },
    {
      "epoch": 1.2245522730751568,
      "grad_norm": 1.5455262660980225,
      "learning_rate": 0.00025265263157894736,
      "loss": 0.817,
      "step": 32000
    },
    {
      "epoch": 1.2245522730751568,
      "eval_loss": Infinity,
      "eval_runtime": 314.3401,
      "eval_samples_per_second": 22.339,
      "eval_steps_per_second": 2.793,
      "eval_wer": 0.6709726041887032,
      "step": 32000
    },
    {
      "epoch": 1.2436859023419562,
      "grad_norm": 1.185735821723938,
      "learning_rate": 0.00025190075187969923,
      "loss": 0.7835,
      "step": 32500
    },
    {
      "epoch": 1.2628195316087556,
      "grad_norm": 0.8058122396469116,
      "learning_rate": 0.0002511503759398496,
      "loss": 0.7975,
      "step": 33000
    },
    {
      "epoch": 1.2628195316087556,
      "eval_loss": Infinity,
      "eval_runtime": 315.7071,
      "eval_samples_per_second": 22.242,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.66950497144066,
      "step": 33000
    },
    {
      "epoch": 1.2819531608755548,
      "grad_norm": 0.6225046515464783,
      "learning_rate": 0.0002503984962406015,
      "loss": 0.8023,
      "step": 33500
    },
    {
      "epoch": 1.3010867901423542,
      "grad_norm": 0.8266538381576538,
      "learning_rate": 0.00024964661654135336,
      "loss": 0.7746,
      "step": 34000
    },
    {
      "epoch": 1.3010867901423542,
      "eval_loss": Infinity,
      "eval_runtime": 316.3157,
      "eval_samples_per_second": 22.199,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.6674423524434102,
      "step": 34000
    },
    {
      "epoch": 1.3202204194091536,
      "grad_norm": 0.8520437479019165,
      "learning_rate": 0.00024889624060150375,
      "loss": 0.7828,
      "step": 34500
    },
    {
      "epoch": 1.3393540486759528,
      "grad_norm": 0.9565845131874084,
      "learning_rate": 0.0002481443609022556,
      "loss": 0.8013,
      "step": 35000
    },
    {
      "epoch": 1.3393540486759528,
      "eval_loss": Infinity,
      "eval_runtime": 315.1504,
      "eval_samples_per_second": 22.281,
      "eval_steps_per_second": 2.786,
      "eval_wer": 0.6586762217050983,
      "step": 35000
    },
    {
      "epoch": 1.3584876779427522,
      "grad_norm": 1.2239874601364136,
      "learning_rate": 0.0002473924812030075,
      "loss": 0.7765,
      "step": 35500
    },
    {
      "epoch": 1.3776213072095516,
      "grad_norm": 0.6564140319824219,
      "learning_rate": 0.00024664060150375935,
      "loss": 0.7703,
      "step": 36000
    },
    {
      "epoch": 1.3776213072095516,
      "eval_loss": Infinity,
      "eval_runtime": 316.0508,
      "eval_samples_per_second": 22.218,
      "eval_steps_per_second": 2.778,
      "eval_wer": 0.6388301248148932,
      "step": 36000
    },
    {
      "epoch": 1.3967549364763507,
      "grad_norm": 0.7060734629631042,
      "learning_rate": 0.0002458887218045113,
      "loss": 0.7685,
      "step": 36500
    },
    {
      "epoch": 1.4158885657431501,
      "grad_norm": 1.3065494298934937,
      "learning_rate": 0.00024513684210526314,
      "loss": 0.7581,
      "step": 37000
    },
    {
      "epoch": 1.4158885657431501,
      "eval_loss": Infinity,
      "eval_runtime": 315.8618,
      "eval_samples_per_second": 22.231,
      "eval_steps_per_second": 2.78,
      "eval_wer": 0.6461021789718637,
      "step": 37000
    },
    {
      "epoch": 1.4350221950099495,
      "grad_norm": 1.282378911972046,
      "learning_rate": 0.00024438646616541354,
      "loss": 0.7693,
      "step": 37500
    },
    {
      "epoch": 1.4541558242767487,
      "grad_norm": 1.1911076307296753,
      "learning_rate": 0.00024363458646616538,
      "loss": 0.7468,
      "step": 38000
    },
    {
      "epoch": 1.4541558242767487,
      "eval_loss": Infinity,
      "eval_runtime": 316.6111,
      "eval_samples_per_second": 22.179,
      "eval_steps_per_second": 2.773,
      "eval_wer": 0.6333959170721388,
      "step": 38000
    },
    {
      "epoch": 1.4732894535435481,
      "grad_norm": 0.7600271105766296,
      "learning_rate": 0.00024288270676691727,
      "loss": 0.7582,
      "step": 38500
    },
    {
      "epoch": 1.4924230828103475,
      "grad_norm": 0.6814852356910706,
      "learning_rate": 0.00024213082706766914,
      "loss": 0.7534,
      "step": 39000
    },
    {
      "epoch": 1.4924230828103475,
      "eval_loss": Infinity,
      "eval_runtime": 316.0864,
      "eval_samples_per_second": 22.215,
      "eval_steps_per_second": 2.778,
      "eval_wer": 0.6300639940765813,
      "step": 39000
    },
    {
      "epoch": 1.5115567120771467,
      "grad_norm": 0.7314792275428772,
      "learning_rate": 0.00024137894736842104,
      "loss": 0.7336,
      "step": 39500
    },
    {
      "epoch": 1.530690341343946,
      "grad_norm": 1.1860034465789795,
      "learning_rate": 0.0002406270676691729,
      "loss": 0.752,
      "step": 40000
    },
    {
      "epoch": 1.530690341343946,
      "eval_loss": Infinity,
      "eval_runtime": 318.462,
      "eval_samples_per_second": 22.05,
      "eval_steps_per_second": 2.757,
      "eval_wer": 0.6221969536704041,
      "step": 40000
    },
    {
      "epoch": 1.5498239706107455,
      "grad_norm": 1.3469467163085938,
      "learning_rate": 0.0002398766917293233,
      "loss": 0.7508,
      "step": 40500
    },
    {
      "epoch": 1.5689575998775447,
      "grad_norm": 0.7789831757545471,
      "learning_rate": 0.00023912481203007516,
      "loss": 0.736,
      "step": 41000
    },
    {
      "epoch": 1.5689575998775447,
      "eval_loss": Infinity,
      "eval_runtime": 316.8112,
      "eval_samples_per_second": 22.165,
      "eval_steps_per_second": 2.771,
      "eval_wer": 0.6203326634228897,
      "step": 41000
    },
    {
      "epoch": 1.588091229144344,
      "grad_norm": 1.3181277513504028,
      "learning_rate": 0.00023837443609022553,
      "loss": 0.752,
      "step": 41500
    },
    {
      "epoch": 1.6072248584111435,
      "grad_norm": 0.6017114520072937,
      "learning_rate": 0.00023762255639097742,
      "loss": 0.7188,
      "step": 42000
    },
    {
      "epoch": 1.6072248584111435,
      "eval_loss": Infinity,
      "eval_runtime": 315.1913,
      "eval_samples_per_second": 22.279,
      "eval_steps_per_second": 2.786,
      "eval_wer": 0.620795430505606,
      "step": 42000
    },
    {
      "epoch": 1.6263584876779427,
      "grad_norm": 0.7502321600914001,
      "learning_rate": 0.0002368706766917293,
      "loss": 0.7138,
      "step": 42500
    },
    {
      "epoch": 1.645492116944742,
      "grad_norm": 0.6769944429397583,
      "learning_rate": 0.00023611879699248119,
      "loss": 0.7308,
      "step": 43000
    },
    {
      "epoch": 1.645492116944742,
      "eval_loss": Infinity,
      "eval_runtime": 316.0035,
      "eval_samples_per_second": 22.221,
      "eval_steps_per_second": 2.778,
      "eval_wer": 0.6056695578591073,
      "step": 43000
    },
    {
      "epoch": 1.6646257462115415,
      "grad_norm": 1.050374984741211,
      "learning_rate": 0.00023536691729323305,
      "loss": 0.7145,
      "step": 43500
    },
    {
      "epoch": 1.6837593754783406,
      "grad_norm": 1.2912209033966064,
      "learning_rate": 0.00023461503759398495,
      "loss": 0.7179,
      "step": 44000
    },
    {
      "epoch": 1.6837593754783406,
      "eval_loss": Infinity,
      "eval_runtime": 315.6998,
      "eval_samples_per_second": 22.243,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.6291649037444468,
      "step": 44000
    },
    {
      "epoch": 1.70289300474514,
      "grad_norm": 0.8525875210762024,
      "learning_rate": 0.00023386315789473682,
      "loss": 0.7237,
      "step": 44500
    },
    {
      "epoch": 1.7220266340119394,
      "grad_norm": 1.1356332302093506,
      "learning_rate": 0.0002331112781954887,
      "loss": 0.7341,
      "step": 45000
    },
    {
      "epoch": 1.7220266340119394,
      "eval_loss": Infinity,
      "eval_runtime": 316.323,
      "eval_samples_per_second": 22.199,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.6034218320287709,
      "step": 45000
    },
    {
      "epoch": 1.7411602632787386,
      "grad_norm": 0.6900098323822021,
      "learning_rate": 0.00023235939849624058,
      "loss": 0.7166,
      "step": 45500
    },
    {
      "epoch": 1.760293892545538,
      "grad_norm": 0.7305801510810852,
      "learning_rate": 0.00023160902255639097,
      "loss": 0.7061,
      "step": 46000
    },
    {
      "epoch": 1.760293892545538,
      "eval_loss": Infinity,
      "eval_runtime": 315.9517,
      "eval_samples_per_second": 22.225,
      "eval_steps_per_second": 2.779,
      "eval_wer": 0.6136555955151258,
      "step": 46000
    },
    {
      "epoch": 1.7794275218123374,
      "grad_norm": 1.960204839706421,
      "learning_rate": 0.00023085714285714284,
      "loss": 0.688,
      "step": 46500
    },
    {
      "epoch": 1.7985611510791366,
      "grad_norm": 1.001535415649414,
      "learning_rate": 0.00023010526315789473,
      "loss": 0.7081,
      "step": 47000
    },
    {
      "epoch": 1.7985611510791366,
      "eval_loss": Infinity,
      "eval_runtime": 316.7057,
      "eval_samples_per_second": 22.172,
      "eval_steps_per_second": 2.772,
      "eval_wer": 0.6123334038502222,
      "step": 47000
    },
    {
      "epoch": 1.817694780345936,
      "grad_norm": 0.8360883593559265,
      "learning_rate": 0.0002293533834586466,
      "loss": 0.704,
      "step": 47500
    },
    {
      "epoch": 1.8368284096127354,
      "grad_norm": 1.349821925163269,
      "learning_rate": 0.0002286015037593985,
      "loss": 0.6957,
      "step": 48000
    },
    {
      "epoch": 1.8368284096127354,
      "eval_loss": Infinity,
      "eval_runtime": 316.3207,
      "eval_samples_per_second": 22.199,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.6053522318595304,
      "step": 48000
    },
    {
      "epoch": 1.8559620388795346,
      "grad_norm": 0.9751301407814026,
      "learning_rate": 0.00022785112781954886,
      "loss": 0.6974,
      "step": 48500
    },
    {
      "epoch": 1.875095668146334,
      "grad_norm": 0.7246661186218262,
      "learning_rate": 0.00022710075187969923,
      "loss": 0.7052,
      "step": 49000
    },
    {
      "epoch": 1.875095668146334,
      "eval_loss": Infinity,
      "eval_runtime": 315.447,
      "eval_samples_per_second": 22.26,
      "eval_steps_per_second": 2.783,
      "eval_wer": 0.616498307594669,
      "step": 49000
    },
    {
      "epoch": 1.8942292974131334,
      "grad_norm": 0.716491162776947,
      "learning_rate": 0.00022634887218045112,
      "loss": 0.6898,
      "step": 49500
    },
    {
      "epoch": 1.9133629266799326,
      "grad_norm": 0.7438942193984985,
      "learning_rate": 0.000225596992481203,
      "loss": 0.6833,
      "step": 50000
    },
    {
      "epoch": 1.9133629266799326,
      "eval_loss": Infinity,
      "eval_runtime": 316.1363,
      "eval_samples_per_second": 22.212,
      "eval_steps_per_second": 2.777,
      "eval_wer": 0.5887455045483393,
      "step": 50000
    },
    {
      "epoch": 1.932496555946732,
      "grad_norm": 0.8066436648368835,
      "learning_rate": 0.00022484511278195488,
      "loss": 0.6755,
      "step": 50500
    },
    {
      "epoch": 1.9516301852135314,
      "grad_norm": 0.6446587443351746,
      "learning_rate": 0.00022409323308270672,
      "loss": 0.6995,
      "step": 51000
    },
    {
      "epoch": 1.9516301852135314,
      "eval_loss": Infinity,
      "eval_runtime": 315.7016,
      "eval_samples_per_second": 22.243,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.5871456526338058,
      "step": 51000
    },
    {
      "epoch": 1.9707638144803306,
      "grad_norm": 0.8823833465576172,
      "learning_rate": 0.00022334135338345862,
      "loss": 0.6909,
      "step": 51500
    },
    {
      "epoch": 1.98989744374713,
      "grad_norm": 0.8129588961601257,
      "learning_rate": 0.0002225894736842105,
      "loss": 0.6703,
      "step": 52000
    },
    {
      "epoch": 1.98989744374713,
      "eval_loss": Infinity,
      "eval_runtime": 316.397,
      "eval_samples_per_second": 22.194,
      "eval_steps_per_second": 2.775,
      "eval_wer": 0.5954357943727523,
      "step": 52000
    },
    {
      "epoch": 2.0090310730139294,
      "grad_norm": 0.9364180564880371,
      "learning_rate": 0.0002218390977443609,
      "loss": 0.6462,
      "step": 52500
    },
    {
      "epoch": 2.0281647022807285,
      "grad_norm": 0.5429893732070923,
      "learning_rate": 0.00022108721804511275,
      "loss": 0.6265,
      "step": 53000
    },
    {
      "epoch": 2.0281647022807285,
      "eval_loss": Infinity,
      "eval_runtime": 315.6741,
      "eval_samples_per_second": 22.244,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.5791728368944362,
      "step": 53000
    },
    {
      "epoch": 2.0472983315475277,
      "grad_norm": 0.7964287996292114,
      "learning_rate": 0.00022033533834586464,
      "loss": 0.6283,
      "step": 53500
    },
    {
      "epoch": 2.0664319608143273,
      "grad_norm": 0.928997278213501,
      "learning_rate": 0.0002195834586466165,
      "loss": 0.633,
      "step": 54000
    },
    {
      "epoch": 2.0664319608143273,
      "eval_loss": Infinity,
      "eval_runtime": 316.8143,
      "eval_samples_per_second": 22.164,
      "eval_steps_per_second": 2.771,
      "eval_wer": 0.5696001692405331,
      "step": 54000
    },
    {
      "epoch": 2.0855655900811265,
      "grad_norm": 0.9358041882514954,
      "learning_rate": 0.0002188315789473684,
      "loss": 0.6608,
      "step": 54500
    },
    {
      "epoch": 2.1046992193479257,
      "grad_norm": 0.49673086404800415,
      "learning_rate": 0.00021807969924812027,
      "loss": 0.6399,
      "step": 55000
    },
    {
      "epoch": 2.1046992193479257,
      "eval_loss": Infinity,
      "eval_runtime": 316.4793,
      "eval_samples_per_second": 22.188,
      "eval_steps_per_second": 2.774,
      "eval_wer": 0.5717685635709753,
      "step": 55000
    },
    {
      "epoch": 2.1238328486147253,
      "grad_norm": 0.824380099773407,
      "learning_rate": 0.00021732932330827064,
      "loss": 0.6317,
      "step": 55500
    },
    {
      "epoch": 2.1429664778815245,
      "grad_norm": 0.784487783908844,
      "learning_rate": 0.00021657744360902253,
      "loss": 0.6165,
      "step": 56000
    },
    {
      "epoch": 2.1429664778815245,
      "eval_loss": Infinity,
      "eval_runtime": 314.9557,
      "eval_samples_per_second": 22.295,
      "eval_steps_per_second": 2.788,
      "eval_wer": 0.5836550666384599,
      "step": 56000
    },
    {
      "epoch": 2.1621001071483237,
      "grad_norm": 1.1931605339050293,
      "learning_rate": 0.0002158270676691729,
      "loss": 0.6268,
      "step": 56500
    },
    {
      "epoch": 2.1812337364151233,
      "grad_norm": 1.4376397132873535,
      "learning_rate": 0.0002150751879699248,
      "loss": 0.6148,
      "step": 57000
    },
    {
      "epoch": 2.1812337364151233,
      "eval_loss": Infinity,
      "eval_runtime": 314.0058,
      "eval_samples_per_second": 22.363,
      "eval_steps_per_second": 2.796,
      "eval_wer": 0.5597233975037021,
      "step": 57000
    },
    {
      "epoch": 2.2003673656819225,
      "grad_norm": 1.6363264322280884,
      "learning_rate": 0.00021432330827067666,
      "loss": 0.6377,
      "step": 57500
    },
    {
      "epoch": 2.2195009949487217,
      "grad_norm": 4.29092264175415,
      "learning_rate": 0.00021357142857142855,
      "loss": 0.6228,
      "step": 58000
    },
    {
      "epoch": 2.2195009949487217,
      "eval_loss": Infinity,
      "eval_runtime": 314.1699,
      "eval_samples_per_second": 22.351,
      "eval_steps_per_second": 2.795,
      "eval_wer": 0.5706843664057542,
      "step": 58000
    },
    {
      "epoch": 2.2386346242155213,
      "grad_norm": 1.1523572206497192,
      "learning_rate": 0.00021281954887218042,
      "loss": 0.6243,
      "step": 58500
    },
    {
      "epoch": 2.2577682534823205,
      "grad_norm": 2.0131170749664307,
      "learning_rate": 0.00021206766917293232,
      "loss": 0.6302,
      "step": 59000
    },
    {
      "epoch": 2.2577682534823205,
      "eval_loss": Infinity,
      "eval_runtime": 315.1147,
      "eval_samples_per_second": 22.284,
      "eval_steps_per_second": 2.786,
      "eval_wer": 0.5717685635709753,
      "step": 59000
    },
    {
      "epoch": 2.2769018827491196,
      "grad_norm": 1.358688235282898,
      "learning_rate": 0.00021131578947368419,
      "loss": 0.612,
      "step": 59500
    },
    {
      "epoch": 2.2960355120159193,
      "grad_norm": 0.5921105742454529,
      "learning_rate": 0.00021056390977443608,
      "loss": 0.6035,
      "step": 60000
    },
    {
      "epoch": 2.2960355120159193,
      "eval_loss": Infinity,
      "eval_runtime": 314.6822,
      "eval_samples_per_second": 22.315,
      "eval_steps_per_second": 2.79,
      "eval_wer": 0.5638883012481489,
      "step": 60000
    },
    {
      "epoch": 2.3151691412827184,
      "grad_norm": 0.600351095199585,
      "learning_rate": 0.00020981203007518795,
      "loss": 0.6157,
      "step": 60500
    },
    {
      "epoch": 2.3343027705495176,
      "grad_norm": 1.6874371767044067,
      "learning_rate": 0.00020906015037593984,
      "loss": 0.602,
      "step": 61000
    },
    {
      "epoch": 2.3343027705495176,
      "eval_loss": Infinity,
      "eval_runtime": 316.103,
      "eval_samples_per_second": 22.214,
      "eval_steps_per_second": 2.778,
      "eval_wer": 0.5633197588322403,
      "step": 61000
    },
    {
      "epoch": 2.3534363998163172,
      "grad_norm": 0.5364500284194946,
      "learning_rate": 0.0002083082706766917,
      "loss": 0.6057,
      "step": 61500
    },
    {
      "epoch": 2.3725700290831164,
      "grad_norm": 1.9607787132263184,
      "learning_rate": 0.0002075563909774436,
      "loss": 0.6023,
      "step": 62000
    },
    {
      "epoch": 2.3725700290831164,
      "eval_loss": Infinity,
      "eval_runtime": 314.4546,
      "eval_samples_per_second": 22.331,
      "eval_steps_per_second": 2.792,
      "eval_wer": 0.5581103236725196,
      "step": 62000
    },
    {
      "epoch": 2.3917036583499156,
      "grad_norm": 1.1173665523529053,
      "learning_rate": 0.00020680451127819547,
      "loss": 0.6097,
      "step": 62500
    },
    {
      "epoch": 2.4108372876167152,
      "grad_norm": 1.7585097551345825,
      "learning_rate": 0.00020605563909774434,
      "loss": 0.5924,
      "step": 63000
    },
    {
      "epoch": 2.4108372876167152,
      "eval_loss": Infinity,
      "eval_runtime": 314.7721,
      "eval_samples_per_second": 22.308,
      "eval_steps_per_second": 2.789,
      "eval_wer": 0.5511820393484239,
      "step": 63000
    },
    {
      "epoch": 2.4299709168835144,
      "grad_norm": 0.9437362551689148,
      "learning_rate": 0.00020530375939849623,
      "loss": 0.5968,
      "step": 63500
    },
    {
      "epoch": 2.4491045461503136,
      "grad_norm": 0.6077060103416443,
      "learning_rate": 0.0002045518796992481,
      "loss": 0.5969,
      "step": 64000
    },
    {
      "epoch": 2.4491045461503136,
      "eval_loss": Infinity,
      "eval_runtime": 314.4786,
      "eval_samples_per_second": 22.329,
      "eval_steps_per_second": 2.792,
      "eval_wer": 0.5489739792680347,
      "step": 64000
    },
    {
      "epoch": 2.468238175417113,
      "grad_norm": 1.9816350936889648,
      "learning_rate": 0.0002038,
      "loss": 0.5978,
      "step": 64500
    },
    {
      "epoch": 2.4873718046839124,
      "grad_norm": 1.865081787109375,
      "learning_rate": 0.00020304812030075186,
      "loss": 0.6029,
      "step": 65000
    },
    {
      "epoch": 2.4873718046839124,
      "eval_loss": Infinity,
      "eval_runtime": 314.4282,
      "eval_samples_per_second": 22.333,
      "eval_steps_per_second": 2.792,
      "eval_wer": 0.5444124180241168,
      "step": 65000
    },
    {
      "epoch": 2.5065054339507116,
      "grad_norm": 0.9471901059150696,
      "learning_rate": 0.00020229624060150376,
      "loss": 0.6068,
      "step": 65500
    },
    {
      "epoch": 2.525639063217511,
      "grad_norm": 1.5803519487380981,
      "learning_rate": 0.0002015443609022556,
      "loss": 0.6046,
      "step": 66000
    },
    {
      "epoch": 2.525639063217511,
      "eval_loss": Infinity,
      "eval_runtime": 316.3481,
      "eval_samples_per_second": 22.197,
      "eval_steps_per_second": 2.775,
      "eval_wer": 0.5460519356885974,
      "step": 66000
    },
    {
      "epoch": 2.5447726924843104,
      "grad_norm": 0.7890714406967163,
      "learning_rate": 0.0002007924812030075,
      "loss": 0.5865,
      "step": 66500
    },
    {
      "epoch": 2.5639063217511096,
      "grad_norm": 0.7467088103294373,
      "learning_rate": 0.00020004060150375936,
      "loss": 0.6095,
      "step": 67000
    },
    {
      "epoch": 2.5639063217511096,
      "eval_loss": Infinity,
      "eval_runtime": 316.5673,
      "eval_samples_per_second": 22.182,
      "eval_steps_per_second": 2.774,
      "eval_wer": 0.5476253437698329,
      "step": 67000
    },
    {
      "epoch": 2.583039951017909,
      "grad_norm": 0.7762987613677979,
      "learning_rate": 0.00019928872180451126,
      "loss": 0.5869,
      "step": 67500
    },
    {
      "epoch": 2.6021735802847084,
      "grad_norm": 0.5018890500068665,
      "learning_rate": 0.00019853684210526312,
      "loss": 0.598,
      "step": 68000
    },
    {
      "epoch": 2.6021735802847084,
      "eval_loss": Infinity,
      "eval_runtime": 316.3997,
      "eval_samples_per_second": 22.193,
      "eval_steps_per_second": 2.775,
      "eval_wer": 0.532129257457161,
      "step": 68000
    },
    {
      "epoch": 2.6213072095515075,
      "grad_norm": 1.0056216716766357,
      "learning_rate": 0.00019778496240601502,
      "loss": 0.5821,
      "step": 68500
    },
    {
      "epoch": 2.640440838818307,
      "grad_norm": 1.3957178592681885,
      "learning_rate": 0.00019703308270676689,
      "loss": 0.5812,
      "step": 69000
    },
    {
      "epoch": 2.640440838818307,
      "eval_loss": Infinity,
      "eval_runtime": 315.6807,
      "eval_samples_per_second": 22.244,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.5357388407023482,
      "step": 69000
    },
    {
      "epoch": 2.6595744680851063,
      "grad_norm": 0.6841593384742737,
      "learning_rate": 0.00019628120300751878,
      "loss": 0.5802,
      "step": 69500
    },
    {
      "epoch": 2.6787080973519055,
      "grad_norm": 0.8700592517852783,
      "learning_rate": 0.00019552932330827065,
      "loss": 0.5957,
      "step": 70000
    },
    {
      "epoch": 2.6787080973519055,
      "eval_loss": Infinity,
      "eval_runtime": 316.4344,
      "eval_samples_per_second": 22.191,
      "eval_steps_per_second": 2.775,
      "eval_wer": 0.5368230378675692,
      "step": 70000
    },
    {
      "epoch": 2.697841726618705,
      "grad_norm": 1.0066908597946167,
      "learning_rate": 0.00019477894736842104,
      "loss": 0.5817,
      "step": 70500
    },
    {
      "epoch": 2.7169753558855043,
      "grad_norm": 0.8253029584884644,
      "learning_rate": 0.0001940270676691729,
      "loss": 0.5909,
      "step": 71000
    },
    {
      "epoch": 2.7169753558855043,
      "eval_loss": Infinity,
      "eval_runtime": 318.9129,
      "eval_samples_per_second": 22.019,
      "eval_steps_per_second": 2.753,
      "eval_wer": 0.5239448910514068,
      "step": 71000
    },
    {
      "epoch": 2.7361089851523035,
      "grad_norm": 0.9649154543876648,
      "learning_rate": 0.0001932751879699248,
      "loss": 0.5877,
      "step": 71500
    },
    {
      "epoch": 2.755242614419103,
      "grad_norm": 1.6835025548934937,
      "learning_rate": 0.00019252330827067667,
      "loss": 0.5953,
      "step": 72000
    },
    {
      "epoch": 2.755242614419103,
      "eval_loss": Infinity,
      "eval_runtime": 316.62,
      "eval_samples_per_second": 22.178,
      "eval_steps_per_second": 2.773,
      "eval_wer": 0.5421911360270785,
      "step": 72000
    },
    {
      "epoch": 2.7743762436859023,
      "grad_norm": 1.4002177715301514,
      "learning_rate": 0.00019177443609022553,
      "loss": 0.5811,
      "step": 72500
    },
    {
      "epoch": 2.7935098729527015,
      "grad_norm": 1.1865595579147339,
      "learning_rate": 0.00019102255639097743,
      "loss": 0.5702,
      "step": 73000
    },
    {
      "epoch": 2.7935098729527015,
      "eval_loss": Infinity,
      "eval_runtime": 315.9208,
      "eval_samples_per_second": 22.227,
      "eval_steps_per_second": 2.779,
      "eval_wer": 0.5225698117199069,
      "step": 73000
    },
    {
      "epoch": 2.812643502219501,
      "grad_norm": 0.8575685620307922,
      "learning_rate": 0.0001902706766917293,
      "loss": 0.5806,
      "step": 73500
    },
    {
      "epoch": 2.8317771314863003,
      "grad_norm": 0.9127354025840759,
      "learning_rate": 0.0001895187969924812,
      "loss": 0.5755,
      "step": 74000
    },
    {
      "epoch": 2.8317771314863003,
      "eval_loss": Infinity,
      "eval_runtime": 315.601,
      "eval_samples_per_second": 22.25,
      "eval_steps_per_second": 2.782,
      "eval_wer": 0.5319441506240745,
      "step": 74000
    },
    {
      "epoch": 2.8509107607530995,
      "grad_norm": 1.893068552017212,
      "learning_rate": 0.00018876691729323306,
      "loss": 0.574,
      "step": 74500
    },
    {
      "epoch": 2.870044390019899,
      "grad_norm": 0.7603012323379517,
      "learning_rate": 0.00018801654135338345,
      "loss": 0.5659,
      "step": 75000
    },
    {
      "epoch": 2.870044390019899,
      "eval_loss": Infinity,
      "eval_runtime": 315.7507,
      "eval_samples_per_second": 22.239,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.5286783372117622,
      "step": 75000
    },
    {
      "epoch": 2.8891780192866983,
      "grad_norm": 1.636072039604187,
      "learning_rate": 0.00018726466165413532,
      "loss": 0.5645,
      "step": 75500
    },
    {
      "epoch": 2.9083116485534974,
      "grad_norm": 0.8112033605575562,
      "learning_rate": 0.0001865127819548872,
      "loss": 0.5581,
      "step": 76000
    },
    {
      "epoch": 2.9083116485534974,
      "eval_loss": Infinity,
      "eval_runtime": 315.6028,
      "eval_samples_per_second": 22.249,
      "eval_steps_per_second": 2.782,
      "eval_wer": 0.5277924687962767,
      "step": 76000
    },
    {
      "epoch": 2.927445277820297,
      "grad_norm": 0.8813944458961487,
      "learning_rate": 0.00018576090225563908,
      "loss": 0.573,
      "step": 76500
    },
    {
      "epoch": 2.9465789070870962,
      "grad_norm": 0.7851129174232483,
      "learning_rate": 0.00018501052631578945,
      "loss": 0.5786,
      "step": 77000
    },
    {
      "epoch": 2.9465789070870962,
      "eval_loss": Infinity,
      "eval_runtime": 316.8095,
      "eval_samples_per_second": 22.165,
      "eval_steps_per_second": 2.771,
      "eval_wer": 0.5194626613073832,
      "step": 77000
    },
    {
      "epoch": 2.9657125363538954,
      "grad_norm": 0.9913876056671143,
      "learning_rate": 0.00018425864661654134,
      "loss": 0.5783,
      "step": 77500
    },
    {
      "epoch": 2.984846165620695,
      "grad_norm": 0.9374109506607056,
      "learning_rate": 0.0001835067669172932,
      "loss": 0.5485,
      "step": 78000
    },
    {
      "epoch": 2.984846165620695,
      "eval_loss": Infinity,
      "eval_runtime": 316.6351,
      "eval_samples_per_second": 22.177,
      "eval_steps_per_second": 2.773,
      "eval_wer": 0.5255976306325365,
      "step": 78000
    },
    {
      "epoch": 3.0039797948874942,
      "grad_norm": 0.9412303566932678,
      "learning_rate": 0.0001827548872180451,
      "loss": 0.543,
      "step": 78500
    },
    {
      "epoch": 3.0231134241542934,
      "grad_norm": 0.9871559739112854,
      "learning_rate": 0.00018200300751879697,
      "loss": 0.5113,
      "step": 79000
    },
    {
      "epoch": 3.0231134241542934,
      "eval_loss": Infinity,
      "eval_runtime": 316.7492,
      "eval_samples_per_second": 22.169,
      "eval_steps_per_second": 2.772,
      "eval_wer": 0.5220277131372963,
      "step": 79000
    },
    {
      "epoch": 3.042247053421093,
      "grad_norm": 1.3727389574050903,
      "learning_rate": 0.00018125112781954887,
      "loss": 0.5075,
      "step": 79500
    },
    {
      "epoch": 3.061380682687892,
      "grad_norm": 1.3193981647491455,
      "learning_rate": 0.00018049924812030073,
      "loss": 0.4973,
      "step": 80000
    },
    {
      "epoch": 3.061380682687892,
      "eval_loss": Infinity,
      "eval_runtime": 315.9407,
      "eval_samples_per_second": 22.226,
      "eval_steps_per_second": 2.779,
      "eval_wer": 0.5146102178971864,
      "step": 80000
    },
    {
      "epoch": 3.0805143119546914,
      "grad_norm": 1.4254885911941528,
      "learning_rate": 0.00017974887218045113,
      "loss": 0.5063,
      "step": 80500
    },
    {
      "epoch": 3.099647941221491,
      "grad_norm": 1.1925376653671265,
      "learning_rate": 0.000178996992481203,
      "loss": 0.5085,
      "step": 81000
    },
    {
      "epoch": 3.099647941221491,
      "eval_loss": Infinity,
      "eval_runtime": 315.3194,
      "eval_samples_per_second": 22.269,
      "eval_steps_per_second": 2.784,
      "eval_wer": 0.5240903321345463,
      "step": 81000
    },
    {
      "epoch": 3.11878157048829,
      "grad_norm": 0.8363128304481506,
      "learning_rate": 0.00017824661654135339,
      "loss": 0.5263,
      "step": 81500
    },
    {
      "epoch": 3.1379151997550894,
      "grad_norm": 0.8608238697052002,
      "learning_rate": 0.00017749473684210525,
      "loss": 0.5111,
      "step": 82000
    },
    {
      "epoch": 3.1379151997550894,
      "eval_loss": Infinity,
      "eval_runtime": 316.6205,
      "eval_samples_per_second": 22.178,
      "eval_steps_per_second": 2.773,
      "eval_wer": 0.5104585360693886,
      "step": 82000
    },
    {
      "epoch": 3.157048829021889,
      "grad_norm": 0.7947099208831787,
      "learning_rate": 0.00017674285714285715,
      "loss": 0.496,
      "step": 82500
    },
    {
      "epoch": 3.176182458288688,
      "grad_norm": 0.629405677318573,
      "learning_rate": 0.00017599097744360902,
      "loss": 0.5047,
      "step": 83000
    },
    {
      "epoch": 3.176182458288688,
      "eval_loss": Infinity,
      "eval_runtime": 315.567,
      "eval_samples_per_second": 22.252,
      "eval_steps_per_second": 2.782,
      "eval_wer": 0.5117675058176433,
      "step": 83000
    },
    {
      "epoch": 3.1953160875554873,
      "grad_norm": 0.6956018209457397,
      "learning_rate": 0.0001752390977443609,
      "loss": 0.519,
      "step": 83500
    },
    {
      "epoch": 3.214449716822287,
      "grad_norm": 0.4928194284439087,
      "learning_rate": 0.00017448721804511275,
      "loss": 0.4994,
      "step": 84000
    },
    {
      "epoch": 3.214449716822287,
      "eval_loss": Infinity,
      "eval_runtime": 316.5623,
      "eval_samples_per_second": 22.182,
      "eval_steps_per_second": 2.774,
      "eval_wer": 0.49931246033425003,
      "step": 84000
    },
    {
      "epoch": 3.233583346089086,
      "grad_norm": 0.9308450222015381,
      "learning_rate": 0.00017373533834586465,
      "loss": 0.5108,
      "step": 84500
    },
    {
      "epoch": 3.2527169753558853,
      "grad_norm": 1.1794687509536743,
      "learning_rate": 0.00017298345864661652,
      "loss": 0.5077,
      "step": 85000
    },
    {
      "epoch": 3.2527169753558853,
      "eval_loss": Infinity,
      "eval_runtime": 316.1672,
      "eval_samples_per_second": 22.21,
      "eval_steps_per_second": 2.777,
      "eval_wer": 0.5099825470700232,
      "step": 85000
    },
    {
      "epoch": 3.271850604622685,
      "grad_norm": 0.6575067639350891,
      "learning_rate": 0.0001722315789473684,
      "loss": 0.5123,
      "step": 85500
    },
    {
      "epoch": 3.290984233889484,
      "grad_norm": 0.60300612449646,
      "learning_rate": 0.00017148120300751877,
      "loss": 0.5035,
      "step": 86000
    },
    {
      "epoch": 3.290984233889484,
      "eval_loss": Infinity,
      "eval_runtime": 316.8684,
      "eval_samples_per_second": 22.161,
      "eval_steps_per_second": 2.771,
      "eval_wer": 0.49292627459276495,
      "step": 86000
    },
    {
      "epoch": 3.3101178631562833,
      "grad_norm": 1.378197193145752,
      "learning_rate": 0.00017072932330827064,
      "loss": 0.5036,
      "step": 86500
    },
    {
      "epoch": 3.329251492423083,
      "grad_norm": 0.6758792996406555,
      "learning_rate": 0.00016997894736842103,
      "loss": 0.5045,
      "step": 87000
    },
    {
      "epoch": 3.329251492423083,
      "eval_loss": Infinity,
      "eval_runtime": 315.6861,
      "eval_samples_per_second": 22.244,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.5026311614131584,
      "step": 87000
    },
    {
      "epoch": 3.348385121689882,
      "grad_norm": 0.708972692489624,
      "learning_rate": 0.0001692270676691729,
      "loss": 0.5057,
      "step": 87500
    },
    {
      "epoch": 3.3675187509566813,
      "grad_norm": 1.0322130918502808,
      "learning_rate": 0.0001684751879699248,
      "loss": 0.4951,
      "step": 88000
    },
    {
      "epoch": 3.3675187509566813,
      "eval_loss": Infinity,
      "eval_runtime": 316.1978,
      "eval_samples_per_second": 22.208,
      "eval_steps_per_second": 2.777,
      "eval_wer": 0.49707795642056274,
      "step": 88000
    },
    {
      "epoch": 3.386652380223481,
      "grad_norm": 0.5131962299346924,
      "learning_rate": 0.00016772330827067667,
      "loss": 0.4925,
      "step": 88500
    },
    {
      "epoch": 3.40578600949028,
      "grad_norm": 0.7158399820327759,
      "learning_rate": 0.00016697142857142856,
      "loss": 0.4915,
      "step": 89000
    },
    {
      "epoch": 3.40578600949028,
      "eval_loss": Infinity,
      "eval_runtime": 319.2292,
      "eval_samples_per_second": 21.997,
      "eval_steps_per_second": 2.75,
      "eval_wer": 0.4984133700021155,
      "step": 89000
    },
    {
      "epoch": 3.4249196387570793,
      "grad_norm": 1.1134260892868042,
      "learning_rate": 0.00016621954887218043,
      "loss": 0.5056,
      "step": 89500
    },
    {
      "epoch": 3.444053268023879,
      "grad_norm": 0.7996990084648132,
      "learning_rate": 0.00016546766917293232,
      "loss": 0.4875,
      "step": 90000
    },
    {
      "epoch": 3.444053268023879,
      "eval_loss": Infinity,
      "eval_runtime": 316.288,
      "eval_samples_per_second": 22.201,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.49683996192088004,
      "step": 90000
    },
    {
      "epoch": 3.463186897290678,
      "grad_norm": 1.4016754627227783,
      "learning_rate": 0.0001647157894736842,
      "loss": 0.5019,
      "step": 90500
    },
    {
      "epoch": 3.4823205265574773,
      "grad_norm": 0.6514917016029358,
      "learning_rate": 0.00016396541353383458,
      "loss": 0.4964,
      "step": 91000
    },
    {
      "epoch": 3.4823205265574773,
      "eval_loss": Infinity,
      "eval_runtime": 316.9586,
      "eval_samples_per_second": 22.154,
      "eval_steps_per_second": 2.77,
      "eval_wer": 0.49888935900148085,
      "step": 91000
    },
    {
      "epoch": 3.501454155824277,
      "grad_norm": 0.3953873813152313,
      "learning_rate": 0.00016321353383458645,
      "loss": 0.4878,
      "step": 91500
    },
    {
      "epoch": 3.520587785091076,
      "grad_norm": 0.6485087871551514,
      "learning_rate": 0.00016246165413533832,
      "loss": 0.4767,
      "step": 92000
    },
    {
      "epoch": 3.520587785091076,
      "eval_loss": Infinity,
      "eval_runtime": 317.0491,
      "eval_samples_per_second": 22.148,
      "eval_steps_per_second": 2.769,
      "eval_wer": 0.4921594034271208,
      "step": 92000
    },
    {
      "epoch": 3.5397214143578752,
      "grad_norm": 0.649442732334137,
      "learning_rate": 0.00016170977443609021,
      "loss": 0.491,
      "step": 92500
    },
    {
      "epoch": 3.558855043624675,
      "grad_norm": 0.7617647051811218,
      "learning_rate": 0.00016095939849624058,
      "loss": 0.4765,
      "step": 93000
    },
    {
      "epoch": 3.558855043624675,
      "eval_loss": Infinity,
      "eval_runtime": 317.7633,
      "eval_samples_per_second": 22.098,
      "eval_steps_per_second": 2.763,
      "eval_wer": 0.48691030251745293,
      "step": 93000
    },
    {
      "epoch": 3.577988672891474,
      "grad_norm": 0.5942517518997192,
      "learning_rate": 0.00016020751879699247,
      "loss": 0.4805,
      "step": 93500
    },
    {
      "epoch": 3.597122302158273,
      "grad_norm": 0.9230866432189941,
      "learning_rate": 0.00015945563909774434,
      "loss": 0.4967,
      "step": 94000
    },
    {
      "epoch": 3.597122302158273,
      "eval_loss": Infinity,
      "eval_runtime": 317.3012,
      "eval_samples_per_second": 22.13,
      "eval_steps_per_second": 2.767,
      "eval_wer": 0.49814893166913476,
      "step": 94000
    },
    {
      "epoch": 3.616255931425073,
      "grad_norm": 0.601637065410614,
      "learning_rate": 0.00015870375939849624,
      "loss": 0.5055,
      "step": 94500
    },
    {
      "epoch": 3.635389560691872,
      "grad_norm": 0.6463965773582458,
      "learning_rate": 0.0001579518796992481,
      "loss": 0.4941,
      "step": 95000
    },
    {
      "epoch": 3.635389560691872,
      "eval_loss": Infinity,
      "eval_runtime": 318.5729,
      "eval_samples_per_second": 22.042,
      "eval_steps_per_second": 2.756,
      "eval_wer": 0.49616564417177916,
      "step": 95000
    },
    {
      "epoch": 3.654523189958671,
      "grad_norm": 0.8088521957397461,
      "learning_rate": 0.0001572,
      "loss": 0.4851,
      "step": 95500
    },
    {
      "epoch": 3.673656819225471,
      "grad_norm": 1.0758212804794312,
      "learning_rate": 0.00015644812030075187,
      "loss": 0.4808,
      "step": 96000
    },
    {
      "epoch": 3.673656819225471,
      "eval_loss": Infinity,
      "eval_runtime": 317.3887,
      "eval_samples_per_second": 22.124,
      "eval_steps_per_second": 2.766,
      "eval_wer": 0.4856277766024963,
      "step": 96000
    },
    {
      "epoch": 3.69279044849227,
      "grad_norm": 2.3342583179473877,
      "learning_rate": 0.00015569624060150376,
      "loss": 0.4682,
      "step": 96500
    },
    {
      "epoch": 3.711924077759069,
      "grad_norm": 0.9281033873558044,
      "learning_rate": 0.0001549443609022556,
      "loss": 0.4838,
      "step": 97000
    },
    {
      "epoch": 3.711924077759069,
      "eval_loss": Infinity,
      "eval_runtime": 317.8326,
      "eval_samples_per_second": 22.093,
      "eval_steps_per_second": 2.762,
      "eval_wer": 0.47491802411677597,
      "step": 97000
    },
    {
      "epoch": 3.731057707025869,
      "grad_norm": 0.6656193733215332,
      "learning_rate": 0.00015419248120300753,
      "loss": 0.4893,
      "step": 97500
    },
    {
      "epoch": 3.750191336292668,
      "grad_norm": 0.8286083936691284,
      "learning_rate": 0.0001534421052631579,
      "loss": 0.4644,
      "step": 98000
    },
    {
      "epoch": 3.750191336292668,
      "eval_loss": Infinity,
      "eval_runtime": 317.0552,
      "eval_samples_per_second": 22.148,
      "eval_steps_per_second": 2.769,
      "eval_wer": 0.4738073831182568,
      "step": 98000
    },
    {
      "epoch": 3.769324965559467,
      "grad_norm": 0.7517048716545105,
      "learning_rate": 0.00015269022556390978,
      "loss": 0.4828,
      "step": 98500
    },
    {
      "epoch": 3.788458594826267,
      "grad_norm": 1.126383662223816,
      "learning_rate": 0.00015193834586466163,
      "loss": 0.4818,
      "step": 99000
    },
    {
      "epoch": 3.788458594826267,
      "eval_loss": Infinity,
      "eval_runtime": 317.5174,
      "eval_samples_per_second": 22.115,
      "eval_steps_per_second": 2.765,
      "eval_wer": 0.47370160778506454,
      "step": 99000
    },
    {
      "epoch": 3.807592224093066,
      "grad_norm": 1.257995843887329,
      "learning_rate": 0.00015118646616541352,
      "loss": 0.485,
      "step": 99500
    },
    {
      "epoch": 3.826725853359865,
      "grad_norm": 1.0233116149902344,
      "learning_rate": 0.0001504345864661654,
      "loss": 0.4741,
      "step": 100000
    },
    {
      "epoch": 3.826725853359865,
      "eval_loss": Infinity,
      "eval_runtime": 317.1035,
      "eval_samples_per_second": 22.144,
      "eval_steps_per_second": 2.769,
      "eval_wer": 0.48123810027501585,
      "step": 100000
    },
    {
      "epoch": 3.8458594826266648,
      "grad_norm": 1.8550606966018677,
      "learning_rate": 0.00014968270676691728,
      "loss": 0.4763,
      "step": 100500
    },
    {
      "epoch": 3.864993111893464,
      "grad_norm": 0.8199677467346191,
      "learning_rate": 0.00014893082706766915,
      "loss": 0.4734,
      "step": 101000
    },
    {
      "epoch": 3.864993111893464,
      "eval_loss": Infinity,
      "eval_runtime": 317.4217,
      "eval_samples_per_second": 22.122,
      "eval_steps_per_second": 2.766,
      "eval_wer": 0.4772186376137085,
      "step": 101000
    },
    {
      "epoch": 3.884126741160263,
      "grad_norm": 0.5380846261978149,
      "learning_rate": 0.00014817894736842105,
      "loss": 0.4602,
      "step": 101500
    },
    {
      "epoch": 3.9032603704270628,
      "grad_norm": 1.026496410369873,
      "learning_rate": 0.00014742706766917291,
      "loss": 0.4733,
      "step": 102000
    },
    {
      "epoch": 3.9032603704270628,
      "eval_loss": Infinity,
      "eval_runtime": 317.6547,
      "eval_samples_per_second": 22.106,
      "eval_steps_per_second": 2.764,
      "eval_wer": 0.47355616670192513,
      "step": 102000
    },
    {
      "epoch": 3.922393999693862,
      "grad_norm": 1.4769624471664429,
      "learning_rate": 0.0001466766917293233,
      "loss": 0.477,
      "step": 102500
    },
    {
      "epoch": 3.941527628960661,
      "grad_norm": 1.2881931066513062,
      "learning_rate": 0.00014592481203007517,
      "loss": 0.4937,
      "step": 103000
    },
    {
      "epoch": 3.941527628960661,
      "eval_loss": Infinity,
      "eval_runtime": 317.1763,
      "eval_samples_per_second": 22.139,
      "eval_steps_per_second": 2.768,
      "eval_wer": 0.4694573725407235,
      "step": 103000
    },
    {
      "epoch": 3.9606612582274607,
      "grad_norm": 0.6641072630882263,
      "learning_rate": 0.00014517443609022554,
      "loss": 0.4728,
      "step": 103500
    },
    {
      "epoch": 3.97979488749426,
      "grad_norm": 0.7772675156593323,
      "learning_rate": 0.00014442255639097743,
      "loss": 0.4864,
      "step": 104000
    },
    {
      "epoch": 3.97979488749426,
      "eval_loss": Infinity,
      "eval_runtime": 316.8284,
      "eval_samples_per_second": 22.163,
      "eval_steps_per_second": 2.771,
      "eval_wer": 0.47485191453353076,
      "step": 104000
    },
    {
      "epoch": 3.998928516761059,
      "grad_norm": 0.4977366626262665,
      "learning_rate": 0.0001436706766917293,
      "loss": 0.4671,
      "step": 104500
    },
    {
      "epoch": 4.018062146027859,
      "grad_norm": 1.0952422618865967,
      "learning_rate": 0.00014291879699248117,
      "loss": 0.4126,
      "step": 105000
    },
    {
      "epoch": 4.018062146027859,
      "eval_loss": Infinity,
      "eval_runtime": 318.0988,
      "eval_samples_per_second": 22.075,
      "eval_steps_per_second": 2.76,
      "eval_wer": 0.4635207319653057,
      "step": 105000
    },
    {
      "epoch": 4.0371957752946575,
      "grad_norm": 0.694837212562561,
      "learning_rate": 0.00014216691729323306,
      "loss": 0.4202,
      "step": 105500
    },
    {
      "epoch": 4.056329404561457,
      "grad_norm": 0.7097035646438599,
      "learning_rate": 0.00014141503759398493,
      "loss": 0.4228,
      "step": 106000
    },
    {
      "epoch": 4.056329404561457,
      "eval_loss": Infinity,
      "eval_runtime": 315.7201,
      "eval_samples_per_second": 22.241,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.47007880262322826,
      "step": 106000
    },
    {
      "epoch": 4.075463033828257,
      "grad_norm": 1.1219637393951416,
      "learning_rate": 0.00014066315789473683,
      "loss": 0.4349,
      "step": 106500
    },
    {
      "epoch": 4.094596663095055,
      "grad_norm": 0.5968381762504578,
      "learning_rate": 0.0001399127819548872,
      "loss": 0.4098,
      "step": 107000
    },
    {
      "epoch": 4.094596663095055,
      "eval_loss": Infinity,
      "eval_runtime": 316.2686,
      "eval_samples_per_second": 22.203,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.45890628305479164,
      "step": 107000
    },
    {
      "epoch": 4.113730292361855,
      "grad_norm": 0.5920900106430054,
      "learning_rate": 0.0001391609022556391,
      "loss": 0.4182,
      "step": 107500
    },
    {
      "epoch": 4.132863921628655,
      "grad_norm": 0.45823031663894653,
      "learning_rate": 0.00013840902255639095,
      "loss": 0.4193,
      "step": 108000
    },
    {
      "epoch": 4.132863921628655,
      "eval_loss": Infinity,
      "eval_runtime": 316.9696,
      "eval_samples_per_second": 22.154,
      "eval_steps_per_second": 2.77,
      "eval_wer": 0.46152422255130104,
      "step": 108000
    },
    {
      "epoch": 4.151997550895453,
      "grad_norm": 0.6653383374214172,
      "learning_rate": 0.00013765714285714285,
      "loss": 0.4087,
      "step": 108500
    },
    {
      "epoch": 4.171131180162253,
      "grad_norm": 0.5999200940132141,
      "learning_rate": 0.00013690526315789472,
      "loss": 0.4083,
      "step": 109000
    },
    {
      "epoch": 4.171131180162253,
      "eval_loss": Infinity,
      "eval_runtime": 318.122,
      "eval_samples_per_second": 22.073,
      "eval_steps_per_second": 2.76,
      "eval_wer": 0.46397027713137295,
      "step": 109000
    },
    {
      "epoch": 4.190264809429053,
      "grad_norm": 0.5787246823310852,
      "learning_rate": 0.0001361533834586466,
      "loss": 0.4075,
      "step": 109500
    },
    {
      "epoch": 4.209398438695851,
      "grad_norm": 2.8409461975097656,
      "learning_rate": 0.00013540150375939848,
      "loss": 0.406,
      "step": 110000
    },
    {
      "epoch": 4.209398438695851,
      "eval_loss": Infinity,
      "eval_runtime": 316.8914,
      "eval_samples_per_second": 22.159,
      "eval_steps_per_second": 2.771,
      "eval_wer": 0.46135233763486355,
      "step": 110000
    },
    {
      "epoch": 4.228532067962651,
      "grad_norm": 0.8015612959861755,
      "learning_rate": 0.00013464962406015038,
      "loss": 0.4167,
      "step": 110500
    },
    {
      "epoch": 4.247665697229451,
      "grad_norm": 3.532646417617798,
      "learning_rate": 0.00013389774436090224,
      "loss": 0.4125,
      "step": 111000
    },
    {
      "epoch": 4.247665697229451,
      "eval_loss": Infinity,
      "eval_runtime": 316.906,
      "eval_samples_per_second": 22.158,
      "eval_steps_per_second": 2.771,
      "eval_wer": 0.4608366828855511,
      "step": 111000
    },
    {
      "epoch": 4.266799326496249,
      "grad_norm": 0.7524324059486389,
      "learning_rate": 0.00013314736842105264,
      "loss": 0.4205,
      "step": 111500
    },
    {
      "epoch": 4.285932955763049,
      "grad_norm": 2.5353856086730957,
      "learning_rate": 0.0001323954887218045,
      "loss": 0.4104,
      "step": 112000
    },
    {
      "epoch": 4.285932955763049,
      "eval_loss": Infinity,
      "eval_runtime": 318.4796,
      "eval_samples_per_second": 22.049,
      "eval_steps_per_second": 2.757,
      "eval_wer": 0.44868574148508567,
      "step": 112000
    },
    {
      "epoch": 4.305066585029849,
      "grad_norm": 0.9442459940910339,
      "learning_rate": 0.00013164360902255637,
      "loss": 0.4114,
      "step": 112500
    },
    {
      "epoch": 4.324200214296647,
      "grad_norm": 1.0531048774719238,
      "learning_rate": 0.00013089172932330827,
      "loss": 0.3988,
      "step": 113000
    },
    {
      "epoch": 4.324200214296647,
      "eval_loss": Infinity,
      "eval_runtime": 317.0914,
      "eval_samples_per_second": 22.145,
      "eval_steps_per_second": 2.769,
      "eval_wer": 0.45987148297017133,
      "step": 113000
    },
    {
      "epoch": 4.343333843563447,
      "grad_norm": 0.7277682423591614,
      "learning_rate": 0.00013013984962406013,
      "loss": 0.4164,
      "step": 113500
    },
    {
      "epoch": 4.362467472830247,
      "grad_norm": 0.48210740089416504,
      "learning_rate": 0.00012938796992481203,
      "loss": 0.4034,
      "step": 114000
    },
    {
      "epoch": 4.362467472830247,
      "eval_loss": Infinity,
      "eval_runtime": 318.084,
      "eval_samples_per_second": 22.076,
      "eval_steps_per_second": 2.76,
      "eval_wer": 0.45389517664480644,
      "step": 114000
    },
    {
      "epoch": 4.381601102097045,
      "grad_norm": 1.0025782585144043,
      "learning_rate": 0.0001286375939849624,
      "loss": 0.423,
      "step": 114500
    },
    {
      "epoch": 4.400734731363845,
      "grad_norm": 0.5586313009262085,
      "learning_rate": 0.00012788571428571426,
      "loss": 0.4023,
      "step": 115000
    },
    {
      "epoch": 4.400734731363845,
      "eval_loss": Infinity,
      "eval_runtime": 318.3491,
      "eval_samples_per_second": 22.058,
      "eval_steps_per_second": 2.758,
      "eval_wer": 0.4479585360693886,
      "step": 115000
    },
    {
      "epoch": 4.419868360630645,
      "grad_norm": 0.6510444283485413,
      "learning_rate": 0.00012713383458646616,
      "loss": 0.4041,
      "step": 115500
    },
    {
      "epoch": 4.439001989897443,
      "grad_norm": 0.6380518674850464,
      "learning_rate": 0.00012638195488721802,
      "loss": 0.4026,
      "step": 116000
    },
    {
      "epoch": 4.439001989897443,
      "eval_loss": Infinity,
      "eval_runtime": 318.4508,
      "eval_samples_per_second": 22.051,
      "eval_steps_per_second": 2.757,
      "eval_wer": 0.45242754389676326,
      "step": 116000
    },
    {
      "epoch": 4.458135619164243,
      "grad_norm": 0.7297781109809875,
      "learning_rate": 0.00012563157894736842,
      "loss": 0.4124,
      "step": 116500
    },
    {
      "epoch": 4.477269248431043,
      "grad_norm": 0.9323301911354065,
      "learning_rate": 0.00012487969924812028,
      "loss": 0.4182,
      "step": 117000
    },
    {
      "epoch": 4.477269248431043,
      "eval_loss": Infinity,
      "eval_runtime": 316.9248,
      "eval_samples_per_second": 22.157,
      "eval_steps_per_second": 2.77,
      "eval_wer": 0.44729744023693674,
      "step": 117000
    },
    {
      "epoch": 4.496402877697841,
      "grad_norm": 0.7702882289886475,
      "learning_rate": 0.00012412781954887218,
      "loss": 0.4137,
      "step": 117500
    },
    {
      "epoch": 4.515536506964641,
      "grad_norm": 0.45166295766830444,
      "learning_rate": 0.00012337593984962405,
      "loss": 0.4046,
      "step": 118000
    },
    {
      "epoch": 4.515536506964641,
      "eval_loss": Infinity,
      "eval_runtime": 313.8786,
      "eval_samples_per_second": 22.372,
      "eval_steps_per_second": 2.797,
      "eval_wer": 0.44563147873915804,
      "step": 118000
    },
    {
      "epoch": 4.5346701362314406,
      "grad_norm": 0.8825483322143555,
      "learning_rate": 0.00012262406015037594,
      "loss": 0.4001,
      "step": 118500
    },
    {
      "epoch": 4.553803765498239,
      "grad_norm": 0.5982456207275391,
      "learning_rate": 0.00012187218045112781,
      "loss": 0.4126,
      "step": 119000
    },
    {
      "epoch": 4.553803765498239,
      "eval_loss": Infinity,
      "eval_runtime": 313.2679,
      "eval_samples_per_second": 22.415,
      "eval_steps_per_second": 2.803,
      "eval_wer": 0.4406071504125238,
      "step": 119000
    },
    {
      "epoch": 4.572937394765039,
      "grad_norm": 0.49651646614074707,
      "learning_rate": 0.00012112030075187969,
      "loss": 0.3899,
      "step": 119500
    },
    {
      "epoch": 4.5920710240318385,
      "grad_norm": 0.6609870195388794,
      "learning_rate": 0.00012036842105263157,
      "loss": 0.4144,
      "step": 120000
    },
    {
      "epoch": 4.5920710240318385,
      "eval_loss": Infinity,
      "eval_runtime": 313.9675,
      "eval_samples_per_second": 22.365,
      "eval_steps_per_second": 2.796,
      "eval_wer": 0.44486460757351387,
      "step": 120000
    },
    {
      "epoch": 4.611204653298637,
      "grad_norm": 0.8339817523956299,
      "learning_rate": 0.00011961804511278195,
      "loss": 0.4067,
      "step": 120500
    },
    {
      "epoch": 4.630338282565437,
      "grad_norm": 0.683476984500885,
      "learning_rate": 0.00011886766917293232,
      "loss": 0.4074,
      "step": 121000
    },
    {
      "epoch": 4.630338282565437,
      "eval_loss": Infinity,
      "eval_runtime": 314.2537,
      "eval_samples_per_second": 22.345,
      "eval_steps_per_second": 2.794,
      "eval_wer": 0.44750899090332136,
      "step": 121000
    },
    {
      "epoch": 4.6494719118322365,
      "grad_norm": 0.6157557964324951,
      "learning_rate": 0.0001181172932330827,
      "loss": 0.3947,
      "step": 121500
    },
    {
      "epoch": 4.668605541099035,
      "grad_norm": 0.7728904485702515,
      "learning_rate": 0.00011736541353383457,
      "loss": 0.3922,
      "step": 122000
    },
    {
      "epoch": 4.668605541099035,
      "eval_loss": Infinity,
      "eval_runtime": 312.5029,
      "eval_samples_per_second": 22.47,
      "eval_steps_per_second": 2.81,
      "eval_wer": 0.4387693039983076,
      "step": 122000
    },
    {
      "epoch": 4.687739170365835,
      "grad_norm": 0.6580181121826172,
      "learning_rate": 0.00011661353383458646,
      "loss": 0.3969,
      "step": 122500
    },
    {
      "epoch": 4.7068727996326345,
      "grad_norm": 3.9013619422912598,
      "learning_rate": 0.00011586165413533834,
      "loss": 0.3866,
      "step": 123000
    },
    {
      "epoch": 4.7068727996326345,
      "eval_loss": Infinity,
      "eval_runtime": 312.7382,
      "eval_samples_per_second": 22.453,
      "eval_steps_per_second": 2.807,
      "eval_wer": 0.44741643748677806,
      "step": 123000
    },
    {
      "epoch": 4.726006428899433,
      "grad_norm": 0.7487606406211853,
      "learning_rate": 0.00011510977443609022,
      "loss": 0.4057,
      "step": 123500
    },
    {
      "epoch": 4.745140058166233,
      "grad_norm": 0.9207865595817566,
      "learning_rate": 0.0001143578947368421,
      "loss": 0.3873,
      "step": 124000
    },
    {
      "epoch": 4.745140058166233,
      "eval_loss": Infinity,
      "eval_runtime": 312.9132,
      "eval_samples_per_second": 22.441,
      "eval_steps_per_second": 2.806,
      "eval_wer": 0.4344986249206685,
      "step": 124000
    },
    {
      "epoch": 4.7642736874330325,
      "grad_norm": 0.6548067331314087,
      "learning_rate": 0.00011360601503759398,
      "loss": 0.4058,
      "step": 124500
    },
    {
      "epoch": 4.783407316699831,
      "grad_norm": 0.97373366355896,
      "learning_rate": 0.00011285413533834586,
      "loss": 0.3917,
      "step": 125000
    },
    {
      "epoch": 4.783407316699831,
      "eval_loss": Infinity,
      "eval_runtime": 313.7438,
      "eval_samples_per_second": 22.381,
      "eval_steps_per_second": 2.798,
      "eval_wer": 0.4338243071715676,
      "step": 125000
    },
    {
      "epoch": 4.802540945966631,
      "grad_norm": 0.7585910558700562,
      "learning_rate": 0.00011210375939849623,
      "loss": 0.4095,
      "step": 125500
    },
    {
      "epoch": 4.8216745752334305,
      "grad_norm": 1.3345550298690796,
      "learning_rate": 0.0001113533834586466,
      "loss": 0.3864,
      "step": 126000
    },
    {
      "epoch": 4.8216745752334305,
      "eval_loss": Infinity,
      "eval_runtime": 312.643,
      "eval_samples_per_second": 22.46,
      "eval_steps_per_second": 2.808,
      "eval_wer": 0.4350803892532262,
      "step": 126000
    },
    {
      "epoch": 4.840808204500229,
      "grad_norm": 0.6124061346054077,
      "learning_rate": 0.00011060150375939849,
      "loss": 0.3909,
      "step": 126500
    },
    {
      "epoch": 4.859941833767029,
      "grad_norm": 0.7190678119659424,
      "learning_rate": 0.00010984962406015037,
      "loss": 0.3826,
      "step": 127000
    },
    {
      "epoch": 4.859941833767029,
      "eval_loss": Infinity,
      "eval_runtime": 312.9649,
      "eval_samples_per_second": 22.437,
      "eval_steps_per_second": 2.805,
      "eval_wer": 0.430783266342289,
      "step": 127000
    },
    {
      "epoch": 4.879075463033828,
      "grad_norm": 0.9486848711967468,
      "learning_rate": 0.00010909774436090225,
      "loss": 0.3974,
      "step": 127500
    },
    {
      "epoch": 4.898209092300627,
      "grad_norm": 3.170478343963623,
      "learning_rate": 0.00010834736842105263,
      "loss": 0.391,
      "step": 128000
    },
    {
      "epoch": 4.898209092300627,
      "eval_loss": Infinity,
      "eval_runtime": 313.5327,
      "eval_samples_per_second": 22.396,
      "eval_steps_per_second": 2.8,
      "eval_wer": 0.431497249841337,
      "step": 128000
    },
    {
      "epoch": 4.917342721567427,
      "grad_norm": 0.462166428565979,
      "learning_rate": 0.000107596992481203,
      "loss": 0.3817,
      "step": 128500
    },
    {
      "epoch": 4.936476350834226,
      "grad_norm": 1.1014796495437622,
      "learning_rate": 0.00010684511278195487,
      "loss": 0.394,
      "step": 129000
    },
    {
      "epoch": 4.936476350834226,
      "eval_loss": Infinity,
      "eval_runtime": 313.0162,
      "eval_samples_per_second": 22.433,
      "eval_steps_per_second": 2.805,
      "eval_wer": 0.42787444467950075,
      "step": 129000
    },
    {
      "epoch": 4.955609980101025,
      "grad_norm": 0.624528706073761,
      "learning_rate": 0.00010609323308270676,
      "loss": 0.3821,
      "step": 129500
    },
    {
      "epoch": 4.974743609367825,
      "grad_norm": 0.5960122346878052,
      "learning_rate": 0.00010534135338345864,
      "loss": 0.3957,
      "step": 130000
    },
    {
      "epoch": 4.974743609367825,
      "eval_loss": Infinity,
      "eval_runtime": 313.106,
      "eval_samples_per_second": 22.427,
      "eval_steps_per_second": 2.804,
      "eval_wer": 0.4235112121853184,
      "step": 130000
    },
    {
      "epoch": 4.993877238634624,
      "grad_norm": 0.7740840911865234,
      "learning_rate": 0.0001045894736842105,
      "loss": 0.4012,
      "step": 130500
    },
    {
      "epoch": 5.013010867901423,
      "grad_norm": 0.39604371786117554,
      "learning_rate": 0.00010383759398496239,
      "loss": 0.3515,
      "step": 131000
    },
    {
      "epoch": 5.013010867901423,
      "eval_loss": Infinity,
      "eval_runtime": 312.7575,
      "eval_samples_per_second": 22.452,
      "eval_steps_per_second": 2.807,
      "eval_wer": 0.42159403427120795,
      "step": 131000
    },
    {
      "epoch": 5.032144497168223,
      "grad_norm": 0.582255482673645,
      "learning_rate": 0.00010308571428571427,
      "loss": 0.332,
      "step": 131500
    },
    {
      "epoch": 5.051278126435022,
      "grad_norm": 1.186954379081726,
      "learning_rate": 0.00010233383458646615,
      "loss": 0.3389,
      "step": 132000
    },
    {
      "epoch": 5.051278126435022,
      "eval_loss": Infinity,
      "eval_runtime": 312.5025,
      "eval_samples_per_second": 22.47,
      "eval_steps_per_second": 2.81,
      "eval_wer": 0.42548127776602496,
      "step": 132000
    },
    {
      "epoch": 5.070411755701821,
      "grad_norm": 0.7782790064811707,
      "learning_rate": 0.00010158195488721803,
      "loss": 0.3352,
      "step": 132500
    },
    {
      "epoch": 5.089545384968621,
      "grad_norm": 0.5987495183944702,
      "learning_rate": 0.00010083157894736841,
      "loss": 0.333,
      "step": 133000
    },
    {
      "epoch": 5.089545384968621,
      "eval_loss": Infinity,
      "eval_runtime": 514.1295,
      "eval_samples_per_second": 13.658,
      "eval_steps_per_second": 1.708,
      "eval_wer": 0.42526972709964034,
      "step": 133000
    },
    {
      "epoch": 5.10867901423542,
      "grad_norm": 0.714470624923706,
      "learning_rate": 0.0001000812030075188,
      "loss": 0.3334,
      "step": 133500
    },
    {
      "epoch": 5.127812643502219,
      "grad_norm": 0.554375171661377,
      "learning_rate": 9.932932330827067e-05,
      "loss": 0.3313,
      "step": 134000
    },
    {
      "epoch": 5.127812643502219,
      "eval_loss": Infinity,
      "eval_runtime": 313.7907,
      "eval_samples_per_second": 22.378,
      "eval_steps_per_second": 2.798,
      "eval_wer": 0.4178390099428813,
      "step": 134000
    },
    {
      "epoch": 5.146946272769019,
      "grad_norm": 0.8462457060813904,
      "learning_rate": 9.857744360902255e-05,
      "loss": 0.3391,
      "step": 134500
    },
    {
      "epoch": 5.166079902035818,
      "grad_norm": 0.5063708424568176,
      "learning_rate": 9.782556390977443e-05,
      "loss": 0.3351,
      "step": 135000
    },
    {
      "epoch": 5.166079902035818,
      "eval_loss": Infinity,
      "eval_runtime": 314.6864,
      "eval_samples_per_second": 22.314,
      "eval_steps_per_second": 2.79,
      "eval_wer": 0.422321239686905,
      "step": 135000
    },
    {
      "epoch": 5.185213531302617,
      "grad_norm": 0.5310961008071899,
      "learning_rate": 9.707368421052631e-05,
      "loss": 0.3435,
      "step": 135500
    },
    {
      "epoch": 5.204347160569417,
      "grad_norm": 0.7004749774932861,
      "learning_rate": 9.63218045112782e-05,
      "loss": 0.3262,
      "step": 136000
    },
    {
      "epoch": 5.204347160569417,
      "eval_loss": Infinity,
      "eval_runtime": 314.217,
      "eval_samples_per_second": 22.348,
      "eval_steps_per_second": 2.794,
      "eval_wer": 0.416318489528242,
      "step": 136000
    },
    {
      "epoch": 5.223480789836216,
      "grad_norm": 0.5730725526809692,
      "learning_rate": 9.556992481203008e-05,
      "loss": 0.333,
      "step": 136500
    },
    {
      "epoch": 5.242614419103015,
      "grad_norm": 1.6563917398452759,
      "learning_rate": 9.481804511278196e-05,
      "loss": 0.3333,
      "step": 137000
    },
    {
      "epoch": 5.242614419103015,
      "eval_loss": Infinity,
      "eval_runtime": 315.3953,
      "eval_samples_per_second": 22.264,
      "eval_steps_per_second": 2.784,
      "eval_wer": 0.42156759043790987,
      "step": 137000
    },
    {
      "epoch": 5.261748048369815,
      "grad_norm": 0.5844420790672302,
      "learning_rate": 9.406616541353384e-05,
      "loss": 0.3369,
      "step": 137500
    },
    {
      "epoch": 5.280881677636614,
      "grad_norm": 0.6321229934692383,
      "learning_rate": 9.331428571428571e-05,
      "loss": 0.3229,
      "step": 138000
    },
    {
      "epoch": 5.280881677636614,
      "eval_loss": Infinity,
      "eval_runtime": 315.3276,
      "eval_samples_per_second": 22.269,
      "eval_steps_per_second": 2.784,
      "eval_wer": 0.41326422678231434,
      "step": 138000
    },
    {
      "epoch": 5.300015306903413,
      "grad_norm": 0.6538165807723999,
      "learning_rate": 9.256240601503759e-05,
      "loss": 0.3382,
      "step": 138500
    },
    {
      "epoch": 5.319148936170213,
      "grad_norm": 0.7837240099906921,
      "learning_rate": 9.181052631578947e-05,
      "loss": 0.3345,
      "step": 139000
    },
    {
      "epoch": 5.319148936170213,
      "eval_loss": Infinity,
      "eval_runtime": 316.2249,
      "eval_samples_per_second": 22.206,
      "eval_steps_per_second": 2.777,
      "eval_wer": 0.4136079966151893,
      "step": 139000
    },
    {
      "epoch": 5.338282565437012,
      "grad_norm": 0.8858345150947571,
      "learning_rate": 9.106015037593984e-05,
      "loss": 0.3293,
      "step": 139500
    },
    {
      "epoch": 5.357416194703811,
      "grad_norm": 1.3112056255340576,
      "learning_rate": 9.030827067669172e-05,
      "loss": 0.3365,
      "step": 140000
    },
    {
      "epoch": 5.357416194703811,
      "eval_loss": Infinity,
      "eval_runtime": 316.1322,
      "eval_samples_per_second": 22.212,
      "eval_steps_per_second": 2.777,
      "eval_wer": 0.4193330865242226,
      "step": 140000
    },
    {
      "epoch": 5.376549823970611,
      "grad_norm": 0.720756471157074,
      "learning_rate": 8.95563909774436e-05,
      "loss": 0.3318,
      "step": 140500
    },
    {
      "epoch": 5.39568345323741,
      "grad_norm": 0.46977701783180237,
      "learning_rate": 8.880451127819548e-05,
      "loss": 0.3165,
      "step": 141000
    },
    {
      "epoch": 5.39568345323741,
      "eval_loss": Infinity,
      "eval_runtime": 314.295,
      "eval_samples_per_second": 22.342,
      "eval_steps_per_second": 2.794,
      "eval_wer": 0.4112148297017136,
      "step": 141000
    },
    {
      "epoch": 5.414817082504209,
      "grad_norm": 0.7260543704032898,
      "learning_rate": 8.805263157894736e-05,
      "loss": 0.337,
      "step": 141500
    },
    {
      "epoch": 5.433950711771009,
      "grad_norm": 1.3891347646713257,
      "learning_rate": 8.730075187969924e-05,
      "loss": 0.3224,
      "step": 142000
    },
    {
      "epoch": 5.433950711771009,
      "eval_loss": Infinity,
      "eval_runtime": 315.0255,
      "eval_samples_per_second": 22.29,
      "eval_steps_per_second": 2.787,
      "eval_wer": 0.40745980537338694,
      "step": 142000
    },
    {
      "epoch": 5.453084341037808,
      "grad_norm": 0.4979989528656006,
      "learning_rate": 8.654887218045112e-05,
      "loss": 0.3341,
      "step": 142500
    },
    {
      "epoch": 5.472217970304607,
      "grad_norm": 0.9820772409439087,
      "learning_rate": 8.579699248120299e-05,
      "loss": 0.335,
      "step": 143000
    },
    {
      "epoch": 5.472217970304607,
      "eval_loss": Infinity,
      "eval_runtime": 314.1397,
      "eval_samples_per_second": 22.353,
      "eval_steps_per_second": 2.795,
      "eval_wer": 0.4112941612016078,
      "step": 143000
    },
    {
      "epoch": 5.491351599571407,
      "grad_norm": 1.6596304178237915,
      "learning_rate": 8.504511278195487e-05,
      "loss": 0.3243,
      "step": 143500
    },
    {
      "epoch": 5.510485228838206,
      "grad_norm": 0.687848687171936,
      "learning_rate": 8.429323308270675e-05,
      "loss": 0.3377,
      "step": 144000
    },
    {
      "epoch": 5.510485228838206,
      "eval_loss": Infinity,
      "eval_runtime": 315.8491,
      "eval_samples_per_second": 22.232,
      "eval_steps_per_second": 2.78,
      "eval_wer": 0.41762745927649675,
      "step": 144000
    },
    {
      "epoch": 5.529618858105005,
      "grad_norm": 1.0538053512573242,
      "learning_rate": 8.354135338345864e-05,
      "loss": 0.3195,
      "step": 144500
    },
    {
      "epoch": 5.548752487371805,
      "grad_norm": 0.6369953751564026,
      "learning_rate": 8.278947368421052e-05,
      "loss": 0.3411,
      "step": 145000
    },
    {
      "epoch": 5.548752487371805,
      "eval_loss": Infinity,
      "eval_runtime": 316.0558,
      "eval_samples_per_second": 22.218,
      "eval_steps_per_second": 2.778,
      "eval_wer": 0.4091125449545166,
      "step": 145000
    },
    {
      "epoch": 5.567886116638604,
      "grad_norm": 1.193766474723816,
      "learning_rate": 8.20390977443609e-05,
      "loss": 0.3385,
      "step": 145500
    },
    {
      "epoch": 5.587019745905403,
      "grad_norm": 0.5476765632629395,
      "learning_rate": 8.128721804511278e-05,
      "loss": 0.3247,
      "step": 146000
    },
    {
      "epoch": 5.587019745905403,
      "eval_loss": Infinity,
      "eval_runtime": 315.7439,
      "eval_samples_per_second": 22.24,
      "eval_steps_per_second": 2.781,
      "eval_wer": 0.4096414216204781,
      "step": 146000
    },
    {
      "epoch": 5.606153375172203,
      "grad_norm": 0.9929884076118469,
      "learning_rate": 8.053533834586466e-05,
      "loss": 0.3305,
      "step": 146500
    },
    {
      "epoch": 5.625287004439002,
      "grad_norm": 0.3942908048629761,
      "learning_rate": 7.978345864661654e-05,
      "loss": 0.3304,
      "step": 147000
    },
    {
      "epoch": 5.625287004439002,
      "eval_loss": Infinity,
      "eval_runtime": 314.4131,
      "eval_samples_per_second": 22.334,
      "eval_steps_per_second": 2.793,
      "eval_wer": 0.40843822720541567,
      "step": 147000
    },
    {
      "epoch": 5.644420633705801,
      "grad_norm": 0.7728341221809387,
      "learning_rate": 7.903157894736842e-05,
      "loss": 0.3301,
      "step": 147500
    },
    {
      "epoch": 5.663554262972601,
      "grad_norm": 1.4606784582138062,
      "learning_rate": 7.82796992481203e-05,
      "loss": 0.3267,
      "step": 148000
    },
    {
      "epoch": 5.663554262972601,
      "eval_loss": Infinity,
      "eval_runtime": 314.4256,
      "eval_samples_per_second": 22.333,
      "eval_steps_per_second": 2.792,
      "eval_wer": 0.40423365771102177,
      "step": 148000
    },
    {
      "epoch": 5.6826878922394,
      "grad_norm": 0.6086077690124512,
      "learning_rate": 7.752781954887217e-05,
      "loss": 0.3195,
      "step": 148500
    },
    {
      "epoch": 5.701821521506199,
      "grad_norm": 0.5943909883499146,
      "learning_rate": 7.677593984962405e-05,
      "loss": 0.3193,
      "step": 149000
    },
    {
      "epoch": 5.701821521506199,
      "eval_loss": Infinity,
      "eval_runtime": 314.9231,
      "eval_samples_per_second": 22.298,
      "eval_steps_per_second": 2.788,
      "eval_wer": 0.4026470277131373,
      "step": 149000
    },
    {
      "epoch": 5.7209551507729985,
      "grad_norm": 0.5374177098274231,
      "learning_rate": 7.602556390977442e-05,
      "loss": 0.3374,
      "step": 149500
    },
    {
      "epoch": 5.740088780039798,
      "grad_norm": 0.675542950630188,
      "learning_rate": 7.52736842105263e-05,
      "loss": 0.3155,
      "step": 150000
    },
    {
      "epoch": 5.740088780039798,
      "eval_loss": Infinity,
      "eval_runtime": 316.593,
      "eval_samples_per_second": 22.18,
      "eval_steps_per_second": 2.773,
      "eval_wer": 0.40481542204357945,
      "step": 150000
    },
    {
      "epoch": 5.759222409306597,
      "grad_norm": 1.1648385524749756,
      "learning_rate": 7.45218045112782e-05,
      "loss": 0.3247,
      "step": 150500
    },
    {
      "epoch": 5.7783560385733965,
      "grad_norm": 0.6115811467170715,
      "learning_rate": 7.376992481203008e-05,
      "loss": 0.3238,
      "step": 151000
    },
    {
      "epoch": 5.7783560385733965,
      "eval_loss": Infinity,
      "eval_runtime": 318.3837,
      "eval_samples_per_second": 22.055,
      "eval_steps_per_second": 2.758,
      "eval_wer": 0.40333456737888723,
      "step": 151000
    },
    {
      "epoch": 5.797489667840196,
      "grad_norm": 1.0145585536956787,
      "learning_rate": 7.301804511278196e-05,
      "loss": 0.3175,
      "step": 151500
    },
    {
      "epoch": 5.816623297106995,
      "grad_norm": 0.7065938115119934,
      "learning_rate": 7.226766917293232e-05,
      "loss": 0.3172,
      "step": 152000
    },
    {
      "epoch": 5.816623297106995,
      "eval_loss": Infinity,
      "eval_runtime": 318.6878,
      "eval_samples_per_second": 22.034,
      "eval_steps_per_second": 2.755,
      "eval_wer": 0.40486830971017557,
      "step": 152000
    },
    {
      "epoch": 5.8357569263737945,
      "grad_norm": 0.7309425473213196,
      "learning_rate": 7.15172932330827e-05,
      "loss": 0.3229,
      "step": 152500
    },
    {
      "epoch": 5.854890555640594,
      "grad_norm": 1.0197374820709229,
      "learning_rate": 7.076541353383458e-05,
      "loss": 0.3148,
      "step": 153000
    },
    {
      "epoch": 5.854890555640594,
      "eval_loss": Infinity,
      "eval_runtime": 323.1191,
      "eval_samples_per_second": 21.732,
      "eval_steps_per_second": 2.717,
      "eval_wer": 0.3989052253014597,
      "step": 153000
    },
    {
      "epoch": 5.874024184907393,
      "grad_norm": 0.7352388501167297,
      "learning_rate": 7.001503759398496e-05,
      "loss": 0.313,
      "step": 153500
    },
    {
      "epoch": 5.8931578141741925,
      "grad_norm": 0.6405870914459229,
      "learning_rate": 6.926315789473684e-05,
      "loss": 0.3217,
      "step": 154000
    },
    {
      "epoch": 5.8931578141741925,
      "eval_loss": Infinity,
      "eval_runtime": 319.2909,
      "eval_samples_per_second": 21.992,
      "eval_steps_per_second": 2.75,
      "eval_wer": 0.39782102813623865,
      "step": 154000
    },
    {
      "epoch": 5.912291443440992,
      "grad_norm": 0.711800754070282,
      "learning_rate": 6.851127819548872e-05,
      "loss": 0.3206,
      "step": 154500
    },
    {
      "epoch": 5.931425072707791,
      "grad_norm": 0.41337111592292786,
      "learning_rate": 6.77593984962406e-05,
      "loss": 0.3145,
      "step": 155000
    },
    {
      "epoch": 5.931425072707791,
      "eval_loss": Infinity,
      "eval_runtime": 318.549,
      "eval_samples_per_second": 22.044,
      "eval_steps_per_second": 2.756,
      "eval_wer": 0.39298180664269095,
      "step": 155000
    },
    {
      "epoch": 5.9505587019745905,
      "grad_norm": 0.3790297210216522,
      "learning_rate": 6.700751879699248e-05,
      "loss": 0.3185,
      "step": 155500
    },
    {
      "epoch": 5.96969233124139,
      "grad_norm": 0.7092337012290955,
      "learning_rate": 6.625563909774435e-05,
      "loss": 0.3178,
      "step": 156000
    },
    {
      "epoch": 5.96969233124139,
      "eval_loss": Infinity,
      "eval_runtime": 318.815,
      "eval_samples_per_second": 22.025,
      "eval_steps_per_second": 2.754,
      "eval_wer": 0.39946054580071927,
      "step": 156000
    },
    {
      "epoch": 5.988825960508189,
      "grad_norm": 1.5943549871444702,
      "learning_rate": 6.550375939849623e-05,
      "loss": 0.3154,
      "step": 156500
    },
    {
      "epoch": 6.0079595897749885,
      "grad_norm": 1.1709485054016113,
      "learning_rate": 6.475187969924812e-05,
      "loss": 0.2895,
      "step": 157000
    },
    {
      "epoch": 6.0079595897749885,
      "eval_loss": Infinity,
      "eval_runtime": 318.8329,
      "eval_samples_per_second": 22.024,
      "eval_steps_per_second": 2.754,
      "eval_wer": 0.39980431563359425,
      "step": 157000
    },
    {
      "epoch": 6.027093219041788,
      "grad_norm": 0.6642709374427795,
      "learning_rate": 6.4e-05,
      "loss": 0.2714,
      "step": 157500
    },
    {
      "epoch": 6.046226848308587,
      "grad_norm": 0.7695789337158203,
      "learning_rate": 6.324812030075188e-05,
      "loss": 0.269,
      "step": 158000
    },
    {
      "epoch": 6.046226848308587,
      "eval_loss": Infinity,
      "eval_runtime": 318.0108,
      "eval_samples_per_second": 22.081,
      "eval_steps_per_second": 2.761,
      "eval_wer": 0.3926248148931669,
      "step": 158000
    },
    {
      "epoch": 6.065360477575386,
      "grad_norm": 0.6437819600105286,
      "learning_rate": 6.249624060150375e-05,
      "loss": 0.2651,
      "step": 158500
    },
    {
      "epoch": 6.084494106842186,
      "grad_norm": 0.9133914113044739,
      "learning_rate": 6.174436090225563e-05,
      "loss": 0.2757,
      "step": 159000
    },
    {
      "epoch": 6.084494106842186,
      "eval_loss": Infinity,
      "eval_runtime": 317.9915,
      "eval_samples_per_second": 22.082,
      "eval_steps_per_second": 2.761,
      "eval_wer": 0.39225460122699385,
      "step": 159000
    },
    {
      "epoch": 6.103627736108985,
      "grad_norm": 0.8651337623596191,
      "learning_rate": 6.099398496240601e-05,
      "loss": 0.2763,
      "step": 159500
    },
    {
      "epoch": 6.122761365375784,
      "grad_norm": 0.6800199151039124,
      "learning_rate": 6.0243609022556384e-05,
      "loss": 0.2573,
      "step": 160000
    },
    {
      "epoch": 6.122761365375784,
      "eval_loss": Infinity,
      "eval_runtime": 318.7524,
      "eval_samples_per_second": 22.03,
      "eval_steps_per_second": 2.754,
      "eval_wer": 0.3906283054791623,
      "step": 160000
    },
    {
      "epoch": 6.141894994642584,
      "grad_norm": 0.7264246940612793,
      "learning_rate": 5.9491729323308265e-05,
      "loss": 0.2632,
      "step": 160500
    },
    {
      "epoch": 6.161028623909383,
      "grad_norm": 0.2874845862388611,
      "learning_rate": 5.873984962406015e-05,
      "loss": 0.2666,
      "step": 161000
    },
    {
      "epoch": 6.161028623909383,
      "eval_loss": Infinity,
      "eval_runtime": 318.0588,
      "eval_samples_per_second": 22.078,
      "eval_steps_per_second": 2.76,
      "eval_wer": 0.38831447006558073,
      "step": 161000
    },
    {
      "epoch": 6.180162253176182,
      "grad_norm": 0.36712953448295593,
      "learning_rate": 5.798796992481202e-05,
      "loss": 0.2719,
      "step": 161500
    },
    {
      "epoch": 6.199295882442982,
      "grad_norm": 1.4700485467910767,
      "learning_rate": 5.72360902255639e-05,
      "loss": 0.2691,
      "step": 162000
    },
    {
      "epoch": 6.199295882442982,
      "eval_loss": Infinity,
      "eval_runtime": 318.6549,
      "eval_samples_per_second": 22.036,
      "eval_steps_per_second": 2.755,
      "eval_wer": 0.391950497144066,
      "step": 162000
    },
    {
      "epoch": 6.218429511709781,
      "grad_norm": 0.664314866065979,
      "learning_rate": 5.6484210526315785e-05,
      "loss": 0.2734,
      "step": 162500
    },
    {
      "epoch": 6.23756314097658,
      "grad_norm": 0.7786546945571899,
      "learning_rate": 5.5732330827067666e-05,
      "loss": 0.2699,
      "step": 163000
    },
    {
      "epoch": 6.23756314097658,
      "eval_loss": Infinity,
      "eval_runtime": 323.3374,
      "eval_samples_per_second": 21.717,
      "eval_steps_per_second": 2.715,
      "eval_wer": 0.39616828855510894,
      "step": 163000
    },
    {
      "epoch": 6.25669677024338,
      "grad_norm": 1.2886419296264648,
      "learning_rate": 5.498045112781954e-05,
      "loss": 0.2702,
      "step": 163500
    },
    {
      "epoch": 6.275830399510179,
      "grad_norm": 0.6407492160797119,
      "learning_rate": 5.422857142857142e-05,
      "loss": 0.259,
      "step": 164000
    },
    {
      "epoch": 6.275830399510179,
      "eval_loss": Infinity,
      "eval_runtime": 318.7872,
      "eval_samples_per_second": 22.027,
      "eval_steps_per_second": 2.754,
      "eval_wer": 0.39016553839644597,
      "step": 164000
    },
    {
      "epoch": 6.294964028776978,
      "grad_norm": 0.36012986302375793,
      "learning_rate": 5.3476691729323304e-05,
      "loss": 0.2591,
      "step": 164500
    },
    {
      "epoch": 6.314097658043778,
      "grad_norm": 0.5582063794136047,
      "learning_rate": 5.2724812030075185e-05,
      "loss": 0.2707,
      "step": 165000
    },
    {
      "epoch": 6.314097658043778,
      "eval_loss": Infinity,
      "eval_runtime": 317.8204,
      "eval_samples_per_second": 22.094,
      "eval_steps_per_second": 2.763,
      "eval_wer": 0.38777237148297017,
      "step": 165000
    },
    {
      "epoch": 6.333231287310577,
      "grad_norm": 0.5500897765159607,
      "learning_rate": 5.197293233082706e-05,
      "loss": 0.2574,
      "step": 165500
    },
    {
      "epoch": 6.352364916577376,
      "grad_norm": 0.5922083854675293,
      "learning_rate": 5.122105263157894e-05,
      "loss": 0.265,
      "step": 166000
    },
    {
      "epoch": 6.352364916577376,
      "eval_loss": Infinity,
      "eval_runtime": 316.5005,
      "eval_samples_per_second": 22.186,
      "eval_steps_per_second": 2.774,
      "eval_wer": 0.38557753331922995,
      "step": 166000
    },
    {
      "epoch": 6.371498545844176,
      "grad_norm": 0.5268240571022034,
      "learning_rate": 5.046917293233082e-05,
      "loss": 0.2693,
      "step": 166500
    },
    {
      "epoch": 6.390632175110975,
      "grad_norm": 2.8765857219696045,
      "learning_rate": 4.9717293233082705e-05,
      "loss": 0.2657,
      "step": 167000
    },
    {
      "epoch": 6.390632175110975,
      "eval_loss": Infinity,
      "eval_runtime": 317.5854,
      "eval_samples_per_second": 22.111,
      "eval_steps_per_second": 2.765,
      "eval_wer": 0.38506187856991747,
      "step": 167000
    },
    {
      "epoch": 6.409765804377774,
      "grad_norm": 0.6294525265693665,
      "learning_rate": 4.896541353383458e-05,
      "loss": 0.2634,
      "step": 167500
    },
    {
      "epoch": 6.428899433644574,
      "grad_norm": 1.270578384399414,
      "learning_rate": 4.821503759398496e-05,
      "loss": 0.2625,
      "step": 168000
    },
    {
      "epoch": 6.428899433644574,
      "eval_loss": Infinity,
      "eval_runtime": 317.2046,
      "eval_samples_per_second": 22.137,
      "eval_steps_per_second": 2.768,
      "eval_wer": 0.3841495663211339,
      "step": 168000
    },
    {
      "epoch": 6.448033062911373,
      "grad_norm": 1.4967974424362183,
      "learning_rate": 4.746315789473684e-05,
      "loss": 0.2679,
      "step": 168500
    },
    {
      "epoch": 6.467166692178172,
      "grad_norm": 0.8087161779403687,
      "learning_rate": 4.671278195488721e-05,
      "loss": 0.2615,
      "step": 169000
    },
    {
      "epoch": 6.467166692178172,
      "eval_loss": Infinity,
      "eval_runtime": 316.9216,
      "eval_samples_per_second": 22.157,
      "eval_steps_per_second": 2.77,
      "eval_wer": 0.3831975883224032,
      "step": 169000
    },
    {
      "epoch": 6.486300321444972,
      "grad_norm": 0.5716475248336792,
      "learning_rate": 4.596090225563909e-05,
      "loss": 0.2507,
      "step": 169500
    },
    {
      "epoch": 6.505433950711771,
      "grad_norm": 0.7699230909347534,
      "learning_rate": 4.520902255639097e-05,
      "loss": 0.2629,
      "step": 170000
    },
    {
      "epoch": 6.505433950711771,
      "eval_loss": Infinity,
      "eval_runtime": 317.644,
      "eval_samples_per_second": 22.107,
      "eval_steps_per_second": 2.764,
      "eval_wer": 0.38342236090543685,
      "step": 170000
    },
    {
      "epoch": 6.52456757997857,
      "grad_norm": 0.8144583702087402,
      "learning_rate": 4.445714285714285e-05,
      "loss": 0.2646,
      "step": 170500
    },
    {
      "epoch": 6.54370120924537,
      "grad_norm": 0.9461275339126587,
      "learning_rate": 4.370526315789473e-05,
      "loss": 0.276,
      "step": 171000
    },
    {
      "epoch": 6.54370120924537,
      "eval_loss": Infinity,
      "eval_runtime": 316.3907,
      "eval_samples_per_second": 22.194,
      "eval_steps_per_second": 2.775,
      "eval_wer": 0.38307859107256187,
      "step": 171000
    },
    {
      "epoch": 6.562834838512169,
      "grad_norm": 0.5300208926200867,
      "learning_rate": 4.295338345864661e-05,
      "loss": 0.2657,
      "step": 171500
    },
    {
      "epoch": 6.581968467778968,
      "grad_norm": 0.611358106136322,
      "learning_rate": 4.220150375939849e-05,
      "loss": 0.2623,
      "step": 172000
    },
    {
      "epoch": 6.581968467778968,
      "eval_loss": Infinity,
      "eval_runtime": 316.1573,
      "eval_samples_per_second": 22.21,
      "eval_steps_per_second": 2.777,
      "eval_wer": 0.38129363232494184,
      "step": 172000
    },
    {
      "epoch": 6.601102097045768,
      "grad_norm": 0.8705514073371887,
      "learning_rate": 4.144962406015037e-05,
      "loss": 0.2614,
      "step": 172500
    },
    {
      "epoch": 6.620235726312567,
      "grad_norm": 0.4813309609889984,
      "learning_rate": 4.069924812030075e-05,
      "loss": 0.27,
      "step": 173000
    },
    {
      "epoch": 6.620235726312567,
      "eval_loss": Infinity,
      "eval_runtime": 316.2461,
      "eval_samples_per_second": 22.204,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.3814787391580283,
      "step": 173000
    },
    {
      "epoch": 6.639369355579366,
      "grad_norm": 2.4199442863464355,
      "learning_rate": 3.994736842105263e-05,
      "loss": 0.261,
      "step": 173500
    },
    {
      "epoch": 6.658502984846166,
      "grad_norm": 0.6200481653213501,
      "learning_rate": 3.919548872180451e-05,
      "loss": 0.2712,
      "step": 174000
    },
    {
      "epoch": 6.658502984846166,
      "eval_loss": Infinity,
      "eval_runtime": 317.1791,
      "eval_samples_per_second": 22.139,
      "eval_steps_per_second": 2.768,
      "eval_wer": 0.3812143008250476,
      "step": 174000
    },
    {
      "epoch": 6.677636614112965,
      "grad_norm": 0.2569734454154968,
      "learning_rate": 3.844360902255639e-05,
      "loss": 0.2614,
      "step": 174500
    },
    {
      "epoch": 6.696770243379764,
      "grad_norm": 0.44579431414604187,
      "learning_rate": 3.769172932330827e-05,
      "loss": 0.263,
      "step": 175000
    },
    {
      "epoch": 6.696770243379764,
      "eval_loss": Infinity,
      "eval_runtime": 316.5662,
      "eval_samples_per_second": 22.182,
      "eval_steps_per_second": 2.774,
      "eval_wer": 0.38161095832451875,
      "step": 175000
    },
    {
      "epoch": 6.715903872646564,
      "grad_norm": 0.38563570380210876,
      "learning_rate": 3.6939849624060146e-05,
      "loss": 0.2488,
      "step": 175500
    },
    {
      "epoch": 6.735037501913363,
      "grad_norm": 0.5862724781036377,
      "learning_rate": 3.6189473684210524e-05,
      "loss": 0.2616,
      "step": 176000
    },
    {
      "epoch": 6.735037501913363,
      "eval_loss": Infinity,
      "eval_runtime": 316.2674,
      "eval_samples_per_second": 22.203,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.379574783160567,
      "step": 176000
    },
    {
      "epoch": 6.754171131180162,
      "grad_norm": 0.5157662034034729,
      "learning_rate": 3.5437593984962405e-05,
      "loss": 0.2525,
      "step": 176500
    },
    {
      "epoch": 6.773304760446962,
      "grad_norm": 0.807600200176239,
      "learning_rate": 3.4687218045112776e-05,
      "loss": 0.253,
      "step": 177000
    },
    {
      "epoch": 6.773304760446962,
      "eval_loss": Infinity,
      "eval_runtime": 316.2322,
      "eval_samples_per_second": 22.205,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.3794161201607785,
      "step": 177000
    },
    {
      "epoch": 6.792438389713761,
      "grad_norm": 0.4601055383682251,
      "learning_rate": 3.393533834586466e-05,
      "loss": 0.2513,
      "step": 177500
    },
    {
      "epoch": 6.81157201898056,
      "grad_norm": 0.4807584881782532,
      "learning_rate": 3.3184962406015036e-05,
      "loss": 0.2572,
      "step": 178000
    },
    {
      "epoch": 6.81157201898056,
      "eval_loss": Infinity,
      "eval_runtime": 314.7771,
      "eval_samples_per_second": 22.308,
      "eval_steps_per_second": 2.789,
      "eval_wer": 0.38285381848952826,
      "step": 178000
    },
    {
      "epoch": 6.83070564824736,
      "grad_norm": 2.668820381164551,
      "learning_rate": 3.243308270676692e-05,
      "loss": 0.2522,
      "step": 178500
    },
    {
      "epoch": 6.8498392775141586,
      "grad_norm": 0.5270944833755493,
      "learning_rate": 3.168270676691729e-05,
      "loss": 0.2517,
      "step": 179000
    },
    {
      "epoch": 6.8498392775141586,
      "eval_loss": Infinity,
      "eval_runtime": 314.726,
      "eval_samples_per_second": 22.311,
      "eval_steps_per_second": 2.79,
      "eval_wer": 0.37728739158028346,
      "step": 179000
    },
    {
      "epoch": 6.868972906780958,
      "grad_norm": 0.5133803486824036,
      "learning_rate": 3.093082706766917e-05,
      "loss": 0.2479,
      "step": 179500
    },
    {
      "epoch": 6.888106536047758,
      "grad_norm": 0.6608215570449829,
      "learning_rate": 3.0178947368421048e-05,
      "loss": 0.2471,
      "step": 180000
    },
    {
      "epoch": 6.888106536047758,
      "eval_loss": Infinity,
      "eval_runtime": 315.1185,
      "eval_samples_per_second": 22.284,
      "eval_steps_per_second": 2.786,
      "eval_wer": 0.37833192299555746,
      "step": 180000
    },
    {
      "epoch": 6.9072401653145565,
      "grad_norm": 0.9923522472381592,
      "learning_rate": 2.942706766917293e-05,
      "loss": 0.2533,
      "step": 180500
    },
    {
      "epoch": 6.926373794581356,
      "grad_norm": 0.6495700478553772,
      "learning_rate": 2.8675187969924808e-05,
      "loss": 0.2441,
      "step": 181000
    },
    {
      "epoch": 6.926373794581356,
      "eval_loss": Infinity,
      "eval_runtime": 315.6279,
      "eval_samples_per_second": 22.248,
      "eval_steps_per_second": 2.782,
      "eval_wer": 0.37630896974825473,
      "step": 181000
    },
    {
      "epoch": 6.945507423848156,
      "grad_norm": 0.5995193123817444,
      "learning_rate": 2.792330827067669e-05,
      "loss": 0.2509,
      "step": 181500
    },
    {
      "epoch": 6.9646410531149545,
      "grad_norm": 0.6942078471183777,
      "learning_rate": 2.7172932330827067e-05,
      "loss": 0.245,
      "step": 182000
    },
    {
      "epoch": 6.9646410531149545,
      "eval_loss": Infinity,
      "eval_runtime": 316.6284,
      "eval_samples_per_second": 22.177,
      "eval_steps_per_second": 2.773,
      "eval_wer": 0.3749338904167548,
      "step": 182000
    },
    {
      "epoch": 6.983774682381754,
      "grad_norm": 0.7296892404556274,
      "learning_rate": 2.6421052631578945e-05,
      "loss": 0.2513,
      "step": 182500
    },
    {
      "epoch": 7.002908311648554,
      "grad_norm": 0.9255119562149048,
      "learning_rate": 2.5669172932330827e-05,
      "loss": 0.235,
      "step": 183000
    },
    {
      "epoch": 7.002908311648554,
      "eval_loss": Infinity,
      "eval_runtime": 315.5684,
      "eval_samples_per_second": 22.252,
      "eval_steps_per_second": 2.782,
      "eval_wer": 0.3724085043367887,
      "step": 183000
    },
    {
      "epoch": 7.0220419409153525,
      "grad_norm": 0.6719674468040466,
      "learning_rate": 2.4917293233082705e-05,
      "loss": 0.2154,
      "step": 183500
    },
    {
      "epoch": 7.041175570182152,
      "grad_norm": 0.5619477033615112,
      "learning_rate": 2.4165413533834586e-05,
      "loss": 0.2281,
      "step": 184000
    },
    {
      "epoch": 7.041175570182152,
      "eval_loss": Infinity,
      "eval_runtime": 316.4942,
      "eval_samples_per_second": 22.187,
      "eval_steps_per_second": 2.774,
      "eval_wer": 0.37427279458430296,
      "step": 184000
    },
    {
      "epoch": 7.060309199448952,
      "grad_norm": 0.7847068309783936,
      "learning_rate": 2.3413533834586465e-05,
      "loss": 0.2184,
      "step": 184500
    },
    {
      "epoch": 7.0794428287157505,
      "grad_norm": 0.7864698171615601,
      "learning_rate": 2.2661654135338346e-05,
      "loss": 0.2155,
      "step": 185000
    },
    {
      "epoch": 7.0794428287157505,
      "eval_loss": Infinity,
      "eval_runtime": 315.7964,
      "eval_samples_per_second": 22.236,
      "eval_steps_per_second": 2.78,
      "eval_wer": 0.3742463507510049,
      "step": 185000
    },
    {
      "epoch": 7.09857645798255,
      "grad_norm": 0.6666255593299866,
      "learning_rate": 2.1909774436090224e-05,
      "loss": 0.2106,
      "step": 185500
    },
    {
      "epoch": 7.11771008724935,
      "grad_norm": 0.5075043439865112,
      "learning_rate": 2.1157894736842106e-05,
      "loss": 0.2177,
      "step": 186000
    },
    {
      "epoch": 7.11771008724935,
      "eval_loss": Infinity,
      "eval_runtime": 316.0968,
      "eval_samples_per_second": 22.215,
      "eval_steps_per_second": 2.778,
      "eval_wer": 0.37367780833509623,
      "step": 186000
    },
    {
      "epoch": 7.1368437165161485,
      "grad_norm": 0.7393398284912109,
      "learning_rate": 2.0406015037593984e-05,
      "loss": 0.2208,
      "step": 186500
    },
    {
      "epoch": 7.155977345782948,
      "grad_norm": 0.3300219476222992,
      "learning_rate": 1.9654135338345865e-05,
      "loss": 0.2107,
      "step": 187000
    },
    {
      "epoch": 7.155977345782948,
      "eval_loss": Infinity,
      "eval_runtime": 315.1907,
      "eval_samples_per_second": 22.279,
      "eval_steps_per_second": 2.786,
      "eval_wer": 0.37078220858895705,
      "step": 187000
    },
    {
      "epoch": 7.175110975049748,
      "grad_norm": 3.2175910472869873,
      "learning_rate": 1.8902255639097743e-05,
      "loss": 0.2032,
      "step": 187500
    },
    {
      "epoch": 7.194244604316546,
      "grad_norm": 0.28260278701782227,
      "learning_rate": 1.8151879699248118e-05,
      "loss": 0.2129,
      "step": 188000
    },
    {
      "epoch": 7.194244604316546,
      "eval_loss": Infinity,
      "eval_runtime": 315.4927,
      "eval_samples_per_second": 22.257,
      "eval_steps_per_second": 2.783,
      "eval_wer": 0.37161518933784643,
      "step": 188000
    },
    {
      "epoch": 7.213378233583346,
      "grad_norm": 1.4389430284500122,
      "learning_rate": 1.74e-05,
      "loss": 0.221,
      "step": 188500
    },
    {
      "epoch": 7.232511862850146,
      "grad_norm": 0.5784205198287964,
      "learning_rate": 1.6648120300751878e-05,
      "loss": 0.2173,
      "step": 189000
    },
    {
      "epoch": 7.232511862850146,
      "eval_loss": Infinity,
      "eval_runtime": 317.5523,
      "eval_samples_per_second": 22.113,
      "eval_steps_per_second": 2.765,
      "eval_wer": 0.36953934842394753,
      "step": 189000
    },
    {
      "epoch": 7.251645492116944,
      "grad_norm": 0.5264465808868408,
      "learning_rate": 1.589624060150376e-05,
      "loss": 0.2102,
      "step": 189500
    },
    {
      "epoch": 7.270779121383744,
      "grad_norm": 1.0469930171966553,
      "learning_rate": 1.5144360902255639e-05,
      "loss": 0.2145,
      "step": 190000
    },
    {
      "epoch": 7.270779121383744,
      "eval_loss": Infinity,
      "eval_runtime": 316.5149,
      "eval_samples_per_second": 22.185,
      "eval_steps_per_second": 2.774,
      "eval_wer": 0.37215728792045694,
      "step": 190000
    },
    {
      "epoch": 7.289912750650544,
      "grad_norm": 0.43167009949684143,
      "learning_rate": 1.4392481203007517e-05,
      "loss": 0.2217,
      "step": 190500
    },
    {
      "epoch": 7.309046379917342,
      "grad_norm": 1.083001732826233,
      "learning_rate": 1.3640601503759397e-05,
      "loss": 0.2116,
      "step": 191000
    },
    {
      "epoch": 7.309046379917342,
      "eval_loss": Infinity,
      "eval_runtime": 315.4082,
      "eval_samples_per_second": 22.263,
      "eval_steps_per_second": 2.784,
      "eval_wer": 0.37024011000634655,
      "step": 191000
    },
    {
      "epoch": 7.328180009184142,
      "grad_norm": 0.5683468580245972,
      "learning_rate": 1.2888721804511277e-05,
      "loss": 0.2085,
      "step": 191500
    },
    {
      "epoch": 7.347313638450942,
      "grad_norm": 0.45209017395973206,
      "learning_rate": 1.2136842105263156e-05,
      "loss": 0.212,
      "step": 192000
    },
    {
      "epoch": 7.347313638450942,
      "eval_loss": Infinity,
      "eval_runtime": 316.0151,
      "eval_samples_per_second": 22.22,
      "eval_steps_per_second": 2.778,
      "eval_wer": 0.37038555108948595,
      "step": 192000
    },
    {
      "epoch": 7.36644726771774,
      "grad_norm": 1.5557799339294434,
      "learning_rate": 1.1384962406015036e-05,
      "loss": 0.2091,
      "step": 192500
    },
    {
      "epoch": 7.38558089698454,
      "grad_norm": 0.456394761800766,
      "learning_rate": 1.0633082706766916e-05,
      "loss": 0.2116,
      "step": 193000
    },
    {
      "epoch": 7.38558089698454,
      "eval_loss": Infinity,
      "eval_runtime": 316.9212,
      "eval_samples_per_second": 22.157,
      "eval_steps_per_second": 2.77,
      "eval_wer": 0.37012111275650517,
      "step": 193000
    },
    {
      "epoch": 7.40471452625134,
      "grad_norm": 0.34570273756980896,
      "learning_rate": 9.881203007518796e-06,
      "loss": 0.2034,
      "step": 193500
    },
    {
      "epoch": 7.423848155518138,
      "grad_norm": 0.6514278054237366,
      "learning_rate": 9.129323308270676e-06,
      "loss": 0.2124,
      "step": 194000
    },
    {
      "epoch": 7.423848155518138,
      "eval_loss": Infinity,
      "eval_runtime": 315.4723,
      "eval_samples_per_second": 22.259,
      "eval_steps_per_second": 2.783,
      "eval_wer": 0.36865348000846204,
      "step": 194000
    },
    {
      "epoch": 7.442981784784938,
      "grad_norm": 0.3534170091152191,
      "learning_rate": 8.378947368421052e-06,
      "loss": 0.2146,
      "step": 194500
    },
    {
      "epoch": 7.462115414051738,
      "grad_norm": 0.6505366563796997,
      "learning_rate": 7.627067669172932e-06,
      "loss": 0.2078,
      "step": 195000
    },
    {
      "epoch": 7.462115414051738,
      "eval_loss": Infinity,
      "eval_runtime": 316.1812,
      "eval_samples_per_second": 22.209,
      "eval_steps_per_second": 2.777,
      "eval_wer": 0.3681113814258515,
      "step": 195000
    },
    {
      "epoch": 7.481249043318536,
      "grad_norm": 0.5068254470825195,
      "learning_rate": 6.8751879699248115e-06,
      "loss": 0.2097,
      "step": 195500
    },
    {
      "epoch": 7.500382672585336,
      "grad_norm": 0.32878100872039795,
      "learning_rate": 6.124812030075188e-06,
      "loss": 0.2158,
      "step": 196000
    },
    {
      "epoch": 7.500382672585336,
      "eval_loss": Infinity,
      "eval_runtime": 316.2612,
      "eval_samples_per_second": 22.203,
      "eval_steps_per_second": 2.776,
      "eval_wer": 0.3682171567590438,
      "step": 196000
    },
    {
      "epoch": 7.519516301852136,
      "grad_norm": 0.9998613595962524,
      "learning_rate": 5.3729323308270675e-06,
      "loss": 0.2031,
      "step": 196500
    },
    {
      "epoch": 7.538649931118934,
      "grad_norm": 0.6963976621627808,
      "learning_rate": 4.622556390977443e-06,
      "loss": 0.2157,
      "step": 197000
    },
    {
      "epoch": 7.538649931118934,
      "eval_loss": Infinity,
      "eval_runtime": 316.927,
      "eval_samples_per_second": 22.157,
      "eval_steps_per_second": 2.77,
      "eval_wer": 0.36727840067696216,
      "step": 197000
    },
    {
      "epoch": 7.557783560385734,
      "grad_norm": 0.6300442218780518,
      "learning_rate": 3.870676691729323e-06,
      "loss": 0.2082,
      "step": 197500
    },
    {
      "epoch": 7.576917189652534,
      "grad_norm": 0.3542906939983368,
      "learning_rate": 3.118796992481203e-06,
      "loss": 0.2045,
      "step": 198000
    },
    {
      "epoch": 7.576917189652534,
      "eval_loss": Infinity,
      "eval_runtime": 317.109,
      "eval_samples_per_second": 22.144,
      "eval_steps_per_second": 2.769,
      "eval_wer": 0.3666834144277554,
      "step": 198000
    },
    {
      "epoch": 7.596050818919332,
      "grad_norm": 0.9721285700798035,
      "learning_rate": 2.366917293233083e-06,
      "loss": 0.209,
      "step": 198500
    },
    {
      "epoch": 7.615184448186132,
      "grad_norm": 0.8516126275062561,
      "learning_rate": 1.6165413533834587e-06,
      "loss": 0.2188,
      "step": 199000
    },
    {
      "epoch": 7.615184448186132,
      "eval_loss": Infinity,
      "eval_runtime": 316.4647,
      "eval_samples_per_second": 22.189,
      "eval_steps_per_second": 2.774,
      "eval_wer": 0.36752961709329385,
      "step": 199000
    },
    {
      "epoch": 7.634318077452932,
      "grad_norm": 0.7036492824554443,
      "learning_rate": 8.646616541353383e-07,
      "loss": 0.2072,
      "step": 199500
    },
    {
      "epoch": 7.65345170671973,
      "grad_norm": 0.5840544104576111,
      "learning_rate": 1.1278195488721805e-07,
      "loss": 0.2041,
      "step": 200000
    },
    {
      "epoch": 7.65345170671973,
      "eval_loss": Infinity,
      "eval_runtime": 315.8635,
      "eval_samples_per_second": 22.231,
      "eval_steps_per_second": 2.78,
      "eval_wer": 0.3670800719272266,
      "step": 200000
    },
    {
      "epoch": 7.65345170671973,
      "step": 200000,
      "total_flos": 1.6865103601997185e+21,
      "train_loss": 0.5320780529403687,
      "train_runtime": 333857.2134,
      "train_samples_per_second": 4.792,
      "train_steps_per_second": 0.599
    }
  ],
  "logging_steps": 500,
  "max_steps": 200000,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 8,
  "save_steps": 4000,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": true
      },
      "attributes": {}
    }
  },
  "total_flos": 1.6865103601997185e+21,
  "train_batch_size": 8,
  "trial_name": null,
  "trial_params": null
}