File size: 1,377 Bytes
e50035b
 
 
 
 
c616ca4
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
{'loss': 1.3869, 'grad_norm': 0.35344821214675903, 'learning_rate': 4.708318749270797e-05, 'epoch': 0.18}
{'loss': 1.387, 'grad_norm': 0.18895003199577332, 'learning_rate': 4.416637498541594e-05, 'epoch': 0.35}
{'loss': 1.3868, 'grad_norm': 0.17408715188503265, 'learning_rate': 4.124956247812391e-05, 'epoch': 0.53}
{'loss': 1.3867, 'grad_norm': 0.15130987763404846, 'learning_rate': 3.8332749970831875e-05, 'epoch': 0.7}
{'loss': 1.3865, 'grad_norm': 0.1569109559059143, 'learning_rate': 3.5415937463539846e-05, 'epoch': 0.88}
[1 0 3 ... 2 3 3] [0 0 2 ... 0 1 0]
{'eval_loss': 1.3862944841384888, 'eval_accuracy': 0.2624910351422424, 'eval_runtime': 9.0806, 'eval_samples_per_second': 460.653, 'eval_steps_per_second': 7.268, 'epoch': 1.0}
{'loss': 1.3864, 'grad_norm': 0.14783084392547607, 'learning_rate': 3.249912495624781e-05, 'epoch': 1.05}
{'loss': 1.3865, 'grad_norm': 0.1413605809211731, 'learning_rate': 2.9582312448955786e-05, 'epoch': 1.23}
{'loss': 1.3867, 'grad_norm': 0.11423461139202118, 'learning_rate': 2.666549994166375e-05, 'epoch': 1.4}
{'loss': 1.3865, 'grad_norm': 0.13234885036945343, 'learning_rate': 2.374868743437172e-05, 'epoch': 1.58}
{'loss': 1.3865, 'grad_norm': 0.11721161007881165, 'learning_rate': 2.083187492707969e-05, 'epoch': 1.75}
{'loss': 1.3865, 'grad_norm': 0.1150147020816803, 'learning_rate': 1.7915062419787655e-05, 'epoch': 1.93}