|
epoch=0 step=74 progress=0.111 eval info {'sparsity_loss': 4.853, 'l1l2_ratio_z12': 22.048, 'l1l2_ratio_z13': 22.067, 'l1l2_ratio_z13_all': 22.094} train info {'sparsity_loss': 4.738, 'l1l2_ratio_z12': 21.977, 'l1l2_ratio_z13': 22.069, 'l1l2_ratio_z13_all': 22.081} |
|
epoch=0 step=148 progress=0.221 eval info {'sparsity_loss': 3.817, 'l1l2_ratio_z12': 20.865, 'l1l2_ratio_z13': 21.497, 'l1l2_ratio_z13_all': 21.807} train info {'sparsity_loss': 4.166, 'l1l2_ratio_z12': 21.612, 'l1l2_ratio_z13': 21.949, 'l1l2_ratio_z13_all': 22.072} |
|
epoch=0 step=222 progress=0.332 eval info {'sparsity_loss': 2.019, 'l1l2_ratio_z12': 18.063, 'l1l2_ratio_z13': 20.341, 'l1l2_ratio_z13_all': 21.472} train info {'sparsity_loss': 2.016, 'l1l2_ratio_z12': 18.956, 'l1l2_ratio_z13': 20.793, 'l1l2_ratio_z13_all': 21.643} |
|
epoch=1 step=74 progress=0.444 eval info {'sparsity_loss': 1.931, 'l1l2_ratio_z12': 17.818, 'l1l2_ratio_z13': 20.208, 'l1l2_ratio_z13_all': 21.486} train info {'sparsity_loss': 1.048, 'l1l2_ratio_z12': 17.301, 'l1l2_ratio_z13': 20.246, 'l1l2_ratio_z13_all': 21.508} |
|
epoch=1 step=148 progress=0.555 eval info {'sparsity_loss': 1.837, 'l1l2_ratio_z12': 17.526, 'l1l2_ratio_z13': 20.168, 'l1l2_ratio_z13_all': 21.485} train info {'sparsity_loss': 0.777, 'l1l2_ratio_z12': 16.856, 'l1l2_ratio_z13': 20.127, 'l1l2_ratio_z13_all': 21.501} |
|
epoch=1 step=222 progress=0.665 eval info {'sparsity_loss': 1.897, 'l1l2_ratio_z12': 17.559, 'l1l2_ratio_z13': 20.121, 'l1l2_ratio_z13_all': 21.476} train info {'sparsity_loss': 0.64, 'l1l2_ratio_z12': 16.471, 'l1l2_ratio_z13': 20.028, 'l1l2_ratio_z13_all': 21.478} |
|
epoch=2 step=74 progress=0.777 eval info {'sparsity_loss': 1.787, 'l1l2_ratio_z12': 17.187, 'l1l2_ratio_z13': 20.038, 'l1l2_ratio_z13_all': 21.438} train info {'sparsity_loss': 0.448, 'l1l2_ratio_z12': 15.951, 'l1l2_ratio_z13': 19.908, 'l1l2_ratio_z13_all': 21.416} |
|
epoch=2 step=148 progress=0.888 eval info {'sparsity_loss': 1.762, 'l1l2_ratio_z12': 16.979, 'l1l2_ratio_z13': 19.961, 'l1l2_ratio_z13_all': 21.39} train info {'sparsity_loss': 0.411, 'l1l2_ratio_z12': 15.817, 'l1l2_ratio_z13': 19.835, 'l1l2_ratio_z13_all': 21.364} |
|
epoch=2 step=222 progress=0.999 eval info {'sparsity_loss': 1.799, 'l1l2_ratio_z12': 17.175, 'l1l2_ratio_z13': 20.007, 'l1l2_ratio_z13_all': 21.423} train info {'sparsity_loss': 0.407, 'l1l2_ratio_z12': 15.763, 'l1l2_ratio_z13': 19.842, 'l1l2_ratio_z13_all': 21.377} |
|
epoch=0 step=74 progress=0.111 eval info {'sparsity_loss': 4.885, 'l1l2_ratio_z12': 22.056, 'l1l2_ratio_z13': 22.061, 'l1l2_ratio_z13_all': 22.085} train info {'sparsity_loss': 4.742, 'l1l2_ratio_z12': 21.978, 'l1l2_ratio_z13': 22.07, 'l1l2_ratio_z13_all': 22.08} |
|
epoch=0 step=148 progress=0.221 eval info {'sparsity_loss': 2.345, 'l1l2_ratio_z12': 19.058, 'l1l2_ratio_z13': 20.721, 'l1l2_ratio_z13_all': 21.525} train info {'sparsity_loss': 3.53, 'l1l2_ratio_z12': 20.752, 'l1l2_ratio_z13': 21.529, 'l1l2_ratio_z13_all': 21.849} |
|
epoch=0 step=222 progress=0.332 eval info {'sparsity_loss': 1.784, 'l1l2_ratio_z12': 17.413, 'l1l2_ratio_z13': 20.03, 'l1l2_ratio_z13_all': 21.309} train info {'sparsity_loss': 1.392, 'l1l2_ratio_z12': 17.868, 'l1l2_ratio_z13': 20.384, 'l1l2_ratio_z13_all': 21.498} |
|
epoch=1 step=74 progress=0.444 eval info {'sparsity_loss': 1.757, 'l1l2_ratio_z12': 17.377, 'l1l2_ratio_z13': 20.077, 'l1l2_ratio_z13_all': 21.394} train info {'sparsity_loss': 0.809, 'l1l2_ratio_z12': 16.659, 'l1l2_ratio_z13': 19.988, 'l1l2_ratio_z13_all': 21.365} |
|
epoch=1 step=148 progress=0.555 eval info {'sparsity_loss': 1.824, 'l1l2_ratio_z12': 16.717, 'l1l2_ratio_z13': 19.728, 'l1l2_ratio_z13_all': 21.187} train info {'sparsity_loss': 0.602, 'l1l2_ratio_z12': 16.155, 'l1l2_ratio_z13': 19.859, 'l1l2_ratio_z13_all': 21.313} |
|
epoch=1 step=222 progress=0.665 eval info {'sparsity_loss': 1.768, 'l1l2_ratio_z12': 16.853, 'l1l2_ratio_z13': 19.839, 'l1l2_ratio_z13_all': 21.263} train info {'sparsity_loss': 0.529, 'l1l2_ratio_z12': 15.902, 'l1l2_ratio_z13': 19.765, 'l1l2_ratio_z13_all': 21.294} |
|
epoch=2 step=74 progress=0.777 eval info {'sparsity_loss': 1.826, 'l1l2_ratio_z12': 16.565, 'l1l2_ratio_z13': 19.745, 'l1l2_ratio_z13_all': 21.22} train info {'sparsity_loss': 0.337, 'l1l2_ratio_z12': 15.245, 'l1l2_ratio_z13': 19.61, 'l1l2_ratio_z13_all': 21.196} |
|
epoch=2 step=148 progress=0.888 eval info {'sparsity_loss': 1.816, 'l1l2_ratio_z12': 16.56, 'l1l2_ratio_z13': 19.741, 'l1l2_ratio_z13_all': 21.223} train info {'sparsity_loss': 0.337, 'l1l2_ratio_z12': 15.237, 'l1l2_ratio_z13': 19.583, 'l1l2_ratio_z13_all': 21.191} |
|
epoch=2 step=222 progress=0.999 eval info {'sparsity_loss': 1.817, 'l1l2_ratio_z12': 16.539, 'l1l2_ratio_z13': 19.719, 'l1l2_ratio_z13_all': 21.212} train info {'sparsity_loss': 0.308, 'l1l2_ratio_z12': 15.175, 'l1l2_ratio_z13': 19.615, 'l1l2_ratio_z13_all': 21.215} |
|
|