{'loss': 2.9598, 'learning_rate': 2.0000000000000003e-06, 'epoch': 0.18}
{'loss': 2.3436, 'learning_rate': 4.000000000000001e-06, 'epoch': 0.36}
{'eval_loss': 1.8791261911392212, 'eval_wer': 0.8870904221802143, 'eval_runtime': 1327.8534, 'eval_samples_per_second': 0.753, 'eval_steps_per_second': 0.047, 'epoch': 0.36}
{'loss': 1.5788, 'learning_rate': 6e-06, 'epoch': 0.54}
{'loss': 1.1682, 'learning_rate': 8.000000000000001e-06, 'epoch': 0.71}
{'eval_loss': 1.0307379961013794, 'eval_wer': 0.5047652804032766, 'eval_runtime': 1238.5009, 'eval_samples_per_second': 0.807, 'eval_steps_per_second': 0.051, 'epoch': 0.71}
{'loss': 0.9354, 'learning_rate': 1e-05, 'epoch': 0.89}
{'loss': 0.7321, 'learning_rate': 9.987820251299121e-06, 'epoch': 1.07}
{'eval_loss': 0.6299881935119629, 'eval_wer': 0.36645400126023947, 'eval_runtime': 830.7332, 'eval_samples_per_second': 1.204, 'eval_steps_per_second': 0.076, 'epoch': 1.07}
{'loss': 0.5397, 'learning_rate': 9.951340343707852e-06, 'epoch': 1.25}
{'loss': 0.4564, 'learning_rate': 9.890738003669029e-06, 'epoch': 1.43}
{'eval_loss': 0.438092440366745, 'eval_wer': 0.35148865784499056, 'eval_runtime': 723.2192, 'eval_samples_per_second': 1.383, 'eval_steps_per_second': 0.087, 'epoch': 1.43}
{'loss': 0.4291, 'learning_rate': 9.806308479691595e-06, 'epoch': 1.61}
{'loss': 0.4095, 'learning_rate': 9.698463103929542e-06, 'epoch': 1.79}
{'eval_loss': 0.40272918343544006, 'eval_wer': 0.33297889098928796, 'eval_runtime': 636.5063, 'eval_samples_per_second': 1.571, 'eval_steps_per_second': 0.099, 'epoch': 1.79}
{'loss': 0.3992, 'learning_rate': 9.567727288213005e-06, 'epoch': 1.97}
{'loss': 0.3813, 'learning_rate': 9.414737964294636e-06, 'epoch': 2.14}
{'eval_loss': 0.3847169280052185, 'eval_wer': 0.3359719596723377, 'eval_runtime': 616.7138, 'eval_samples_per_second': 1.621, 'eval_steps_per_second': 0.102, 'epoch': 2.14}
{'loss': 0.3711, 'learning_rate': 9.24024048078213e-06, 'epoch': 2.32}
{'loss': 0.3667, 'learning_rate': 9.045084971874738e-06, 'epoch': 2.5}
{'eval_loss': 0.37336310744285583, 'eval_wer': 0.33916194076874606, 'eval_runtime': 614.3217, 'eval_samples_per_second': 1.628, 'eval_steps_per_second': 0.103, 'epoch': 2.5}
{'loss': 0.3654, 'learning_rate': 8.83022221559489e-06, 'epoch': 2.68}
{'loss': 0.3583, 'learning_rate': 8.596699001693257e-06, 'epoch': 2.86}
{'eval_loss': 0.3648846447467804, 'eval_wer': 0.34904694391934465, 'eval_runtime': 617.5084, 'eval_samples_per_second': 1.619, 'eval_steps_per_second': 0.102, 'epoch': 2.86}
{'loss': 0.353, 'learning_rate': 8.345653031794292e-06, 'epoch': 3.04}
{'loss': 0.3454, 'learning_rate': 8.078307376628292e-06, 'epoch': 3.22}
{'eval_loss': 0.35879915952682495, 'eval_wer': 0.35715973534971646, 'eval_runtime': 620.7465, 'eval_samples_per_second': 1.611, 'eval_steps_per_second': 0.101, 'epoch': 3.22}
{'loss': 0.3399, 'learning_rate': 7.795964517353734e-06, 'epoch': 3.4}
{'loss': 0.3422, 'learning_rate': 7.500000000000001e-06, 'epoch': 3.57}
{'eval_loss': 0.3536700904369354, 'eval_wer': 0.3704710144927536, 'eval_runtime': 625.9316, 'eval_samples_per_second': 1.598, 'eval_steps_per_second': 0.101, 'epoch': 3.57}
{'loss': 0.3355, 'learning_rate': 7.191855733945388e-06, 'epoch': 3.75}
{'loss': 0.3371, 'learning_rate': 6.873032967079562e-06, 'epoch': 3.93}
{'eval_loss': 0.3503468930721283, 'eval_wer': 0.3811436672967864, 'eval_runtime': 634.2679, 'eval_samples_per_second': 1.577, 'eval_steps_per_second': 0.099, 'epoch': 3.93}
{'loss': 0.3311, 'learning_rate': 6.545084971874738e-06, 'epoch': 4.11}
{'loss': 0.3291, 'learning_rate': 6.209609477998339e-06, 'epoch': 4.29}
{'eval_loss': 0.347513347864151, 'eval_wer': 0.3677930056710775, 'eval_runtime': 615.3576, 'eval_samples_per_second': 1.625, 'eval_steps_per_second': 0.102, 'epoch': 4.29}
{'loss': 0.3273, 'learning_rate': 5.8682408883346535e-06, 'epoch': 4.47}
{'loss': 0.324, 'learning_rate': 5.522642316338268e-06, 'epoch': 4.65}
{'eval_loss': 0.3451197147369385, 'eval_wer': 0.36700535601764334, 'eval_runtime': 628.249, 'eval_samples_per_second': 1.592, 'eval_steps_per_second': 0.1, 'epoch': 4.65}
{'loss': 0.3219, 'learning_rate': 5.174497483512506e-06, 'epoch': 4.83}
{'loss': 0.3262, 'learning_rate': 4.825502516487497e-06, 'epoch': 5.0}
{'eval_loss': 0.34306031465530396, 'eval_wer': 0.3710223692501575, 'eval_runtime': 613.0254, 'eval_samples_per_second': 1.631, 'eval_steps_per_second': 0.103, 'epoch': 5.0}
{'loss': 0.3203, 'learning_rate': 4.477357683661734e-06, 'epoch': 5.18}
{'loss': 0.3168, 'learning_rate': 4.131759111665349e-06, 'epoch': 5.36}
{'eval_loss': 0.34187400341033936, 'eval_wer': 0.3847274732199118, 'eval_runtime': 628.864, 'eval_samples_per_second': 1.59, 'eval_steps_per_second': 0.1, 'epoch': 5.36}
{'loss': 0.3144, 'learning_rate': 3.790390522001662e-06, 'epoch': 5.54}
{'loss': 0.3178, 'learning_rate': 3.4549150281252635e-06, 'epoch': 5.72}
{'eval_loss': 0.34061843156814575, 'eval_wer': 0.3832703213610586, 'eval_runtime': 627.3787, 'eval_samples_per_second': 1.594, 'eval_steps_per_second': 0.1, 'epoch': 5.72}
{'loss': 0.3127, 'learning_rate': 3.12696703292044e-06, 'epoch': 5.9}
{'loss': 0.3136, 'learning_rate': 2.8081442660546126e-06, 'epoch': 6.08}
{'eval_loss': 0.34004053473472595, 'eval_wer': 0.3853182104599874, 'eval_runtime': 597.4949, 'eval_samples_per_second': 1.674, 'eval_steps_per_second': 0.105, 'epoch': 6.08}
{'loss': 0.3126, 'learning_rate': 2.5000000000000015e-06, 'epoch': 6.26}
{'loss': 0.3092, 'learning_rate': 2.204035482646267e-06, 'epoch': 6.43}
{'eval_loss': 0.3392544984817505, 'eval_wer': 0.38961090107120355, 'eval_runtime': 603.3789, 'eval_samples_per_second': 1.657, 'eval_steps_per_second': 0.104, 'epoch': 6.43}
{'loss': 0.3135, 'learning_rate': 1.9216926233717087e-06, 'epoch': 6.61}
{'loss': 0.3106, 'learning_rate': 1.6543469682057105e-06, 'epoch': 6.79}
{'eval_loss': 0.33891087770462036, 'eval_wer': 0.3900047258979206, 'eval_runtime': 587.9522, 'eval_samples_per_second': 1.701, 'eval_steps_per_second': 0.107, 'epoch': 6.79}
{'loss': 0.3094, 'learning_rate': 1.4033009983067454e-06, 'epoch': 6.97}
{'loss': 0.3057, 'learning_rate': 1.1697777844051105e-06, 'epoch': 7.15}
{'eval_loss': 0.33877310156822205, 'eval_wer': 0.38031663516068054, 'eval_runtime': 590.6741, 'eval_samples_per_second': 1.693, 'eval_steps_per_second': 0.107, 'epoch': 7.15}
{'loss': 0.3079, 'learning_rate': 9.549150281252633e-07, 'epoch': 7.33}
{'loss': 0.3087, 'learning_rate': 7.597595192178702e-07, 'epoch': 7.51}
{'eval_loss': 0.33828216791152954, 'eval_wer': 0.39406112161310647, 'eval_runtime': 586.9517, 'eval_samples_per_second': 1.704, 'eval_steps_per_second': 0.107, 'epoch': 7.51}
{'loss': 0.3082, 'learning_rate': 5.852620357053651e-07, 'epoch': 7.69}
{'loss': 0.308, 'learning_rate': 4.322727117869951e-07, 'epoch': 7.86}
{'eval_loss': 0.3381615877151489, 'eval_wer': 0.3873660995589162, 'eval_runtime': 590.3123, 'eval_samples_per_second': 1.694, 'eval_steps_per_second': 0.107, 'epoch': 7.86}
{'loss': 0.3091, 'learning_rate': 3.015368960704584e-07, 'epoch': 8.04}
{'loss': 0.3036, 'learning_rate': 1.9369152030840553e-07, 'epoch': 8.22}
{'eval_loss': 0.33812272548675537, 'eval_wer': 0.38961090107120355, 'eval_runtime': 590.6229, 'eval_samples_per_second': 1.693, 'eval_steps_per_second': 0.107, 'epoch': 8.22}
{'loss': 0.3049, 'learning_rate': 1.0926199633097156e-07, 'epoch': 8.4}
{'loss': 0.3087, 'learning_rate': 4.865965629214819e-08, 'epoch': 8.58}
{'eval_loss': 0.338046669960022, 'eval_wer': 0.3909892879647133, 'eval_runtime': 593.4841, 'eval_samples_per_second': 1.685, 'eval_steps_per_second': 0.106, 'epoch': 8.58}
{'loss': 0.3092, 'learning_rate': 1.2179748700879013e-08, 'epoch': 8.76}
{'loss': 0.3079, 'learning_rate': 0.0, 'epoch': 8.94}
{'eval_loss': 0.3380787670612335, 'eval_wer': 0.38886263390044107, 'eval_runtime': 604.744, 'eval_samples_per_second': 1.654, 'eval_steps_per_second': 0.104, 'epoch': 8.94}
{'train_runtime': 87940.1228, 'train_samples_per_second': 7.278, 'train_steps_per_second': 0.057, 'train_loss': 0.4928088363647461, 'epoch': 8.94}
***** train metrics *****
  epoch                    =              8.94
  train_loss               =            0.4928
  train_runtime            = 1 day, 0:25:40.12
  train_samples_per_second =             7.278
  train_steps_per_second   =             0.057
{'eval_loss': 0.3380787670612335, 'eval_wer': 0.38886263390044107, 'eval_runtime': 601.5847, 'eval_samples_per_second': 1.662, 'eval_steps_per_second': 0.105, 'epoch': 8.94}
***** eval metrics *****
  epoch                   =       8.94
  eval_loss               =     0.3381
  eval_runtime            = 0:10:01.58
  eval_samples            =       1000
  eval_samples_per_second =      1.662
  eval_steps_per_second   =      0.105
  eval_wer                =     0.3889