pszemraj commited on
Commit
0d72eaf
1 Parent(s): 8659f94

End of training

Browse files
all_results.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "epoch": 3.0,
3
+ "eval_loss": 0.423650860786438,
4
+ "eval_matthews_correlation": 0.5894856058137782,
5
+ "eval_runtime": 5.0422,
6
+ "eval_samples": 1043,
7
+ "eval_samples_per_second": 206.853,
8
+ "eval_steps_per_second": 51.763,
9
+ "train_loss": 0.3622648042825917,
10
+ "train_runtime": 157.4171,
11
+ "train_samples": 8551,
12
+ "train_samples_per_second": 162.962,
13
+ "train_steps_per_second": 1.277
14
+ }
eval_results.json ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "epoch": 3.0,
3
+ "eval_loss": 0.423650860786438,
4
+ "eval_matthews_correlation": 0.5894856058137782,
5
+ "eval_runtime": 5.0422,
6
+ "eval_samples": 1043,
7
+ "eval_samples_per_second": 206.853,
8
+ "eval_steps_per_second": 51.763
9
+ }
predict_results_cola.txt ADDED
@@ -0,0 +1,1064 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ index prediction
2
+ 0 acceptable
3
+ 1 acceptable
4
+ 2 acceptable
5
+ 3 acceptable
6
+ 4 unacceptable
7
+ 5 acceptable
8
+ 6 acceptable
9
+ 7 acceptable
10
+ 8 acceptable
11
+ 9 acceptable
12
+ 10 acceptable
13
+ 11 acceptable
14
+ 12 unacceptable
15
+ 13 acceptable
16
+ 14 acceptable
17
+ 15 acceptable
18
+ 16 unacceptable
19
+ 17 acceptable
20
+ 18 unacceptable
21
+ 19 unacceptable
22
+ 20 acceptable
23
+ 21 acceptable
24
+ 22 unacceptable
25
+ 23 acceptable
26
+ 24 acceptable
27
+ 25 acceptable
28
+ 26 acceptable
29
+ 27 unacceptable
30
+ 28 acceptable
31
+ 29 acceptable
32
+ 30 acceptable
33
+ 31 acceptable
34
+ 32 acceptable
35
+ 33 acceptable
36
+ 34 acceptable
37
+ 35 unacceptable
38
+ 36 acceptable
39
+ 37 unacceptable
40
+ 38 acceptable
41
+ 39 acceptable
42
+ 40 unacceptable
43
+ 41 acceptable
44
+ 42 acceptable
45
+ 43 acceptable
46
+ 44 acceptable
47
+ 45 acceptable
48
+ 46 unacceptable
49
+ 47 unacceptable
50
+ 48 unacceptable
51
+ 49 acceptable
52
+ 50 unacceptable
53
+ 51 unacceptable
54
+ 52 acceptable
55
+ 53 acceptable
56
+ 54 unacceptable
57
+ 55 unacceptable
58
+ 56 acceptable
59
+ 57 unacceptable
60
+ 58 acceptable
61
+ 59 acceptable
62
+ 60 unacceptable
63
+ 61 acceptable
64
+ 62 acceptable
65
+ 63 acceptable
66
+ 64 acceptable
67
+ 65 acceptable
68
+ 66 acceptable
69
+ 67 acceptable
70
+ 68 acceptable
71
+ 69 unacceptable
72
+ 70 acceptable
73
+ 71 acceptable
74
+ 72 unacceptable
75
+ 73 acceptable
76
+ 74 acceptable
77
+ 75 acceptable
78
+ 76 unacceptable
79
+ 77 acceptable
80
+ 78 acceptable
81
+ 79 acceptable
82
+ 80 acceptable
83
+ 81 unacceptable
84
+ 82 acceptable
85
+ 83 acceptable
86
+ 84 acceptable
87
+ 85 acceptable
88
+ 86 acceptable
89
+ 87 acceptable
90
+ 88 acceptable
91
+ 89 acceptable
92
+ 90 acceptable
93
+ 91 acceptable
94
+ 92 unacceptable
95
+ 93 acceptable
96
+ 94 acceptable
97
+ 95 acceptable
98
+ 96 acceptable
99
+ 97 acceptable
100
+ 98 acceptable
101
+ 99 acceptable
102
+ 100 unacceptable
103
+ 101 acceptable
104
+ 102 acceptable
105
+ 103 unacceptable
106
+ 104 unacceptable
107
+ 105 acceptable
108
+ 106 acceptable
109
+ 107 acceptable
110
+ 108 acceptable
111
+ 109 acceptable
112
+ 110 acceptable
113
+ 111 acceptable
114
+ 112 acceptable
115
+ 113 acceptable
116
+ 114 acceptable
117
+ 115 unacceptable
118
+ 116 acceptable
119
+ 117 unacceptable
120
+ 118 acceptable
121
+ 119 acceptable
122
+ 120 acceptable
123
+ 121 unacceptable
124
+ 122 acceptable
125
+ 123 unacceptable
126
+ 124 acceptable
127
+ 125 acceptable
128
+ 126 unacceptable
129
+ 127 acceptable
130
+ 128 acceptable
131
+ 129 acceptable
132
+ 130 unacceptable
133
+ 131 acceptable
134
+ 132 acceptable
135
+ 133 acceptable
136
+ 134 acceptable
137
+ 135 acceptable
138
+ 136 acceptable
139
+ 137 acceptable
140
+ 138 unacceptable
141
+ 139 unacceptable
142
+ 140 acceptable
143
+ 141 acceptable
144
+ 142 acceptable
145
+ 143 acceptable
146
+ 144 acceptable
147
+ 145 acceptable
148
+ 146 acceptable
149
+ 147 acceptable
150
+ 148 acceptable
151
+ 149 acceptable
152
+ 150 acceptable
153
+ 151 acceptable
154
+ 152 acceptable
155
+ 153 acceptable
156
+ 154 acceptable
157
+ 155 acceptable
158
+ 156 unacceptable
159
+ 157 unacceptable
160
+ 158 unacceptable
161
+ 159 acceptable
162
+ 160 acceptable
163
+ 161 acceptable
164
+ 162 acceptable
165
+ 163 acceptable
166
+ 164 acceptable
167
+ 165 unacceptable
168
+ 166 unacceptable
169
+ 167 unacceptable
170
+ 168 acceptable
171
+ 169 acceptable
172
+ 170 acceptable
173
+ 171 acceptable
174
+ 172 acceptable
175
+ 173 unacceptable
176
+ 174 acceptable
177
+ 175 acceptable
178
+ 176 acceptable
179
+ 177 acceptable
180
+ 178 acceptable
181
+ 179 acceptable
182
+ 180 acceptable
183
+ 181 acceptable
184
+ 182 unacceptable
185
+ 183 acceptable
186
+ 184 unacceptable
187
+ 185 acceptable
188
+ 186 acceptable
189
+ 187 unacceptable
190
+ 188 acceptable
191
+ 189 acceptable
192
+ 190 acceptable
193
+ 191 unacceptable
194
+ 192 unacceptable
195
+ 193 acceptable
196
+ 194 unacceptable
197
+ 195 acceptable
198
+ 196 unacceptable
199
+ 197 acceptable
200
+ 198 acceptable
201
+ 199 unacceptable
202
+ 200 acceptable
203
+ 201 acceptable
204
+ 202 unacceptable
205
+ 203 acceptable
206
+ 204 acceptable
207
+ 205 acceptable
208
+ 206 acceptable
209
+ 207 acceptable
210
+ 208 acceptable
211
+ 209 acceptable
212
+ 210 acceptable
213
+ 211 acceptable
214
+ 212 acceptable
215
+ 213 acceptable
216
+ 214 acceptable
217
+ 215 acceptable
218
+ 216 acceptable
219
+ 217 unacceptable
220
+ 218 acceptable
221
+ 219 acceptable
222
+ 220 acceptable
223
+ 221 acceptable
224
+ 222 acceptable
225
+ 223 acceptable
226
+ 224 unacceptable
227
+ 225 acceptable
228
+ 226 unacceptable
229
+ 227 acceptable
230
+ 228 unacceptable
231
+ 229 acceptable
232
+ 230 acceptable
233
+ 231 acceptable
234
+ 232 acceptable
235
+ 233 acceptable
236
+ 234 acceptable
237
+ 235 unacceptable
238
+ 236 unacceptable
239
+ 237 acceptable
240
+ 238 unacceptable
241
+ 239 unacceptable
242
+ 240 acceptable
243
+ 241 acceptable
244
+ 242 acceptable
245
+ 243 acceptable
246
+ 244 acceptable
247
+ 245 acceptable
248
+ 246 acceptable
249
+ 247 acceptable
250
+ 248 acceptable
251
+ 249 acceptable
252
+ 250 acceptable
253
+ 251 acceptable
254
+ 252 acceptable
255
+ 253 acceptable
256
+ 254 acceptable
257
+ 255 acceptable
258
+ 256 acceptable
259
+ 257 acceptable
260
+ 258 acceptable
261
+ 259 acceptable
262
+ 260 unacceptable
263
+ 261 acceptable
264
+ 262 acceptable
265
+ 263 acceptable
266
+ 264 unacceptable
267
+ 265 acceptable
268
+ 266 acceptable
269
+ 267 acceptable
270
+ 268 acceptable
271
+ 269 acceptable
272
+ 270 acceptable
273
+ 271 acceptable
274
+ 272 unacceptable
275
+ 273 acceptable
276
+ 274 acceptable
277
+ 275 acceptable
278
+ 276 acceptable
279
+ 277 unacceptable
280
+ 278 acceptable
281
+ 279 unacceptable
282
+ 280 acceptable
283
+ 281 unacceptable
284
+ 282 acceptable
285
+ 283 acceptable
286
+ 284 acceptable
287
+ 285 unacceptable
288
+ 286 acceptable
289
+ 287 acceptable
290
+ 288 acceptable
291
+ 289 acceptable
292
+ 290 acceptable
293
+ 291 acceptable
294
+ 292 acceptable
295
+ 293 unacceptable
296
+ 294 unacceptable
297
+ 295 acceptable
298
+ 296 acceptable
299
+ 297 acceptable
300
+ 298 acceptable
301
+ 299 acceptable
302
+ 300 acceptable
303
+ 301 unacceptable
304
+ 302 acceptable
305
+ 303 acceptable
306
+ 304 acceptable
307
+ 305 acceptable
308
+ 306 unacceptable
309
+ 307 acceptable
310
+ 308 acceptable
311
+ 309 acceptable
312
+ 310 acceptable
313
+ 311 acceptable
314
+ 312 acceptable
315
+ 313 acceptable
316
+ 314 unacceptable
317
+ 315 unacceptable
318
+ 316 unacceptable
319
+ 317 unacceptable
320
+ 318 acceptable
321
+ 319 unacceptable
322
+ 320 unacceptable
323
+ 321 acceptable
324
+ 322 unacceptable
325
+ 323 acceptable
326
+ 324 acceptable
327
+ 325 unacceptable
328
+ 326 acceptable
329
+ 327 unacceptable
330
+ 328 acceptable
331
+ 329 acceptable
332
+ 330 acceptable
333
+ 331 unacceptable
334
+ 332 acceptable
335
+ 333 acceptable
336
+ 334 acceptable
337
+ 335 acceptable
338
+ 336 unacceptable
339
+ 337 acceptable
340
+ 338 acceptable
341
+ 339 acceptable
342
+ 340 acceptable
343
+ 341 acceptable
344
+ 342 acceptable
345
+ 343 unacceptable
346
+ 344 unacceptable
347
+ 345 acceptable
348
+ 346 acceptable
349
+ 347 acceptable
350
+ 348 unacceptable
351
+ 349 unacceptable
352
+ 350 acceptable
353
+ 351 acceptable
354
+ 352 acceptable
355
+ 353 acceptable
356
+ 354 acceptable
357
+ 355 acceptable
358
+ 356 unacceptable
359
+ 357 acceptable
360
+ 358 acceptable
361
+ 359 acceptable
362
+ 360 acceptable
363
+ 361 acceptable
364
+ 362 acceptable
365
+ 363 unacceptable
366
+ 364 acceptable
367
+ 365 acceptable
368
+ 366 acceptable
369
+ 367 acceptable
370
+ 368 acceptable
371
+ 369 acceptable
372
+ 370 unacceptable
373
+ 371 acceptable
374
+ 372 acceptable
375
+ 373 acceptable
376
+ 374 acceptable
377
+ 375 acceptable
378
+ 376 acceptable
379
+ 377 acceptable
380
+ 378 acceptable
381
+ 379 acceptable
382
+ 380 acceptable
383
+ 381 acceptable
384
+ 382 acceptable
385
+ 383 acceptable
386
+ 384 acceptable
387
+ 385 acceptable
388
+ 386 acceptable
389
+ 387 acceptable
390
+ 388 acceptable
391
+ 389 unacceptable
392
+ 390 acceptable
393
+ 391 unacceptable
394
+ 392 unacceptable
395
+ 393 acceptable
396
+ 394 acceptable
397
+ 395 acceptable
398
+ 396 acceptable
399
+ 397 acceptable
400
+ 398 acceptable
401
+ 399 acceptable
402
+ 400 acceptable
403
+ 401 acceptable
404
+ 402 unacceptable
405
+ 403 acceptable
406
+ 404 acceptable
407
+ 405 acceptable
408
+ 406 acceptable
409
+ 407 acceptable
410
+ 408 acceptable
411
+ 409 acceptable
412
+ 410 acceptable
413
+ 411 acceptable
414
+ 412 acceptable
415
+ 413 acceptable
416
+ 414 acceptable
417
+ 415 unacceptable
418
+ 416 acceptable
419
+ 417 acceptable
420
+ 418 unacceptable
421
+ 419 unacceptable
422
+ 420 acceptable
423
+ 421 acceptable
424
+ 422 acceptable
425
+ 423 acceptable
426
+ 424 acceptable
427
+ 425 acceptable
428
+ 426 acceptable
429
+ 427 acceptable
430
+ 428 unacceptable
431
+ 429 unacceptable
432
+ 430 acceptable
433
+ 431 acceptable
434
+ 432 acceptable
435
+ 433 acceptable
436
+ 434 acceptable
437
+ 435 acceptable
438
+ 436 acceptable
439
+ 437 acceptable
440
+ 438 acceptable
441
+ 439 acceptable
442
+ 440 acceptable
443
+ 441 acceptable
444
+ 442 acceptable
445
+ 443 acceptable
446
+ 444 unacceptable
447
+ 445 acceptable
448
+ 446 acceptable
449
+ 447 unacceptable
450
+ 448 acceptable
451
+ 449 acceptable
452
+ 450 acceptable
453
+ 451 acceptable
454
+ 452 acceptable
455
+ 453 acceptable
456
+ 454 acceptable
457
+ 455 acceptable
458
+ 456 acceptable
459
+ 457 acceptable
460
+ 458 acceptable
461
+ 459 unacceptable
462
+ 460 acceptable
463
+ 461 acceptable
464
+ 462 unacceptable
465
+ 463 acceptable
466
+ 464 acceptable
467
+ 465 acceptable
468
+ 466 acceptable
469
+ 467 acceptable
470
+ 468 acceptable
471
+ 469 acceptable
472
+ 470 acceptable
473
+ 471 acceptable
474
+ 472 acceptable
475
+ 473 unacceptable
476
+ 474 acceptable
477
+ 475 unacceptable
478
+ 476 unacceptable
479
+ 477 unacceptable
480
+ 478 acceptable
481
+ 479 unacceptable
482
+ 480 acceptable
483
+ 481 acceptable
484
+ 482 acceptable
485
+ 483 acceptable
486
+ 484 acceptable
487
+ 485 acceptable
488
+ 486 acceptable
489
+ 487 acceptable
490
+ 488 unacceptable
491
+ 489 unacceptable
492
+ 490 acceptable
493
+ 491 unacceptable
494
+ 492 acceptable
495
+ 493 acceptable
496
+ 494 acceptable
497
+ 495 unacceptable
498
+ 496 unacceptable
499
+ 497 acceptable
500
+ 498 acceptable
501
+ 499 acceptable
502
+ 500 acceptable
503
+ 501 acceptable
504
+ 502 acceptable
505
+ 503 acceptable
506
+ 504 unacceptable
507
+ 505 acceptable
508
+ 506 acceptable
509
+ 507 acceptable
510
+ 508 unacceptable
511
+ 509 acceptable
512
+ 510 acceptable
513
+ 511 unacceptable
514
+ 512 acceptable
515
+ 513 acceptable
516
+ 514 acceptable
517
+ 515 acceptable
518
+ 516 acceptable
519
+ 517 unacceptable
520
+ 518 acceptable
521
+ 519 acceptable
522
+ 520 acceptable
523
+ 521 unacceptable
524
+ 522 unacceptable
525
+ 523 acceptable
526
+ 524 unacceptable
527
+ 525 acceptable
528
+ 526 acceptable
529
+ 527 acceptable
530
+ 528 acceptable
531
+ 529 acceptable
532
+ 530 acceptable
533
+ 531 acceptable
534
+ 532 acceptable
535
+ 533 acceptable
536
+ 534 acceptable
537
+ 535 acceptable
538
+ 536 acceptable
539
+ 537 acceptable
540
+ 538 acceptable
541
+ 539 acceptable
542
+ 540 acceptable
543
+ 541 acceptable
544
+ 542 acceptable
545
+ 543 acceptable
546
+ 544 acceptable
547
+ 545 unacceptable
548
+ 546 acceptable
549
+ 547 acceptable
550
+ 548 acceptable
551
+ 549 acceptable
552
+ 550 acceptable
553
+ 551 acceptable
554
+ 552 acceptable
555
+ 553 acceptable
556
+ 554 acceptable
557
+ 555 acceptable
558
+ 556 acceptable
559
+ 557 acceptable
560
+ 558 acceptable
561
+ 559 acceptable
562
+ 560 acceptable
563
+ 561 acceptable
564
+ 562 acceptable
565
+ 563 acceptable
566
+ 564 acceptable
567
+ 565 acceptable
568
+ 566 acceptable
569
+ 567 acceptable
570
+ 568 acceptable
571
+ 569 acceptable
572
+ 570 unacceptable
573
+ 571 unacceptable
574
+ 572 acceptable
575
+ 573 acceptable
576
+ 574 acceptable
577
+ 575 unacceptable
578
+ 576 acceptable
579
+ 577 acceptable
580
+ 578 acceptable
581
+ 579 acceptable
582
+ 580 acceptable
583
+ 581 acceptable
584
+ 582 acceptable
585
+ 583 acceptable
586
+ 584 acceptable
587
+ 585 acceptable
588
+ 586 acceptable
589
+ 587 acceptable
590
+ 588 acceptable
591
+ 589 acceptable
592
+ 590 acceptable
593
+ 591 acceptable
594
+ 592 unacceptable
595
+ 593 acceptable
596
+ 594 acceptable
597
+ 595 acceptable
598
+ 596 acceptable
599
+ 597 acceptable
600
+ 598 acceptable
601
+ 599 acceptable
602
+ 600 acceptable
603
+ 601 acceptable
604
+ 602 acceptable
605
+ 603 acceptable
606
+ 604 unacceptable
607
+ 605 acceptable
608
+ 606 acceptable
609
+ 607 acceptable
610
+ 608 acceptable
611
+ 609 acceptable
612
+ 610 acceptable
613
+ 611 acceptable
614
+ 612 acceptable
615
+ 613 acceptable
616
+ 614 acceptable
617
+ 615 unacceptable
618
+ 616 acceptable
619
+ 617 unacceptable
620
+ 618 unacceptable
621
+ 619 acceptable
622
+ 620 acceptable
623
+ 621 acceptable
624
+ 622 acceptable
625
+ 623 acceptable
626
+ 624 acceptable
627
+ 625 acceptable
628
+ 626 unacceptable
629
+ 627 acceptable
630
+ 628 acceptable
631
+ 629 acceptable
632
+ 630 unacceptable
633
+ 631 acceptable
634
+ 632 acceptable
635
+ 633 unacceptable
636
+ 634 acceptable
637
+ 635 unacceptable
638
+ 636 unacceptable
639
+ 637 acceptable
640
+ 638 unacceptable
641
+ 639 acceptable
642
+ 640 unacceptable
643
+ 641 unacceptable
644
+ 642 unacceptable
645
+ 643 unacceptable
646
+ 644 acceptable
647
+ 645 unacceptable
648
+ 646 acceptable
649
+ 647 acceptable
650
+ 648 unacceptable
651
+ 649 acceptable
652
+ 650 unacceptable
653
+ 651 unacceptable
654
+ 652 acceptable
655
+ 653 unacceptable
656
+ 654 unacceptable
657
+ 655 unacceptable
658
+ 656 unacceptable
659
+ 657 unacceptable
660
+ 658 unacceptable
661
+ 659 acceptable
662
+ 660 acceptable
663
+ 661 acceptable
664
+ 662 acceptable
665
+ 663 acceptable
666
+ 664 acceptable
667
+ 665 acceptable
668
+ 666 acceptable
669
+ 667 acceptable
670
+ 668 unacceptable
671
+ 669 acceptable
672
+ 670 acceptable
673
+ 671 acceptable
674
+ 672 acceptable
675
+ 673 acceptable
676
+ 674 acceptable
677
+ 675 acceptable
678
+ 676 acceptable
679
+ 677 acceptable
680
+ 678 acceptable
681
+ 679 acceptable
682
+ 680 acceptable
683
+ 681 acceptable
684
+ 682 acceptable
685
+ 683 acceptable
686
+ 684 acceptable
687
+ 685 acceptable
688
+ 686 acceptable
689
+ 687 acceptable
690
+ 688 acceptable
691
+ 689 unacceptable
692
+ 690 acceptable
693
+ 691 unacceptable
694
+ 692 acceptable
695
+ 693 acceptable
696
+ 694 unacceptable
697
+ 695 unacceptable
698
+ 696 acceptable
699
+ 697 acceptable
700
+ 698 acceptable
701
+ 699 acceptable
702
+ 700 acceptable
703
+ 701 unacceptable
704
+ 702 unacceptable
705
+ 703 unacceptable
706
+ 704 acceptable
707
+ 705 unacceptable
708
+ 706 acceptable
709
+ 707 unacceptable
710
+ 708 acceptable
711
+ 709 acceptable
712
+ 710 acceptable
713
+ 711 acceptable
714
+ 712 acceptable
715
+ 713 acceptable
716
+ 714 acceptable
717
+ 715 unacceptable
718
+ 716 unacceptable
719
+ 717 unacceptable
720
+ 718 unacceptable
721
+ 719 unacceptable
722
+ 720 acceptable
723
+ 721 unacceptable
724
+ 722 unacceptable
725
+ 723 unacceptable
726
+ 724 unacceptable
727
+ 725 acceptable
728
+ 726 unacceptable
729
+ 727 acceptable
730
+ 728 unacceptable
731
+ 729 acceptable
732
+ 730 acceptable
733
+ 731 unacceptable
734
+ 732 unacceptable
735
+ 733 acceptable
736
+ 734 acceptable
737
+ 735 acceptable
738
+ 736 unacceptable
739
+ 737 acceptable
740
+ 738 acceptable
741
+ 739 unacceptable
742
+ 740 unacceptable
743
+ 741 unacceptable
744
+ 742 unacceptable
745
+ 743 acceptable
746
+ 744 unacceptable
747
+ 745 unacceptable
748
+ 746 unacceptable
749
+ 747 unacceptable
750
+ 748 unacceptable
751
+ 749 unacceptable
752
+ 750 acceptable
753
+ 751 acceptable
754
+ 752 acceptable
755
+ 753 acceptable
756
+ 754 acceptable
757
+ 755 acceptable
758
+ 756 unacceptable
759
+ 757 acceptable
760
+ 758 acceptable
761
+ 759 unacceptable
762
+ 760 acceptable
763
+ 761 acceptable
764
+ 762 acceptable
765
+ 763 acceptable
766
+ 764 acceptable
767
+ 765 acceptable
768
+ 766 acceptable
769
+ 767 acceptable
770
+ 768 acceptable
771
+ 769 acceptable
772
+ 770 acceptable
773
+ 771 acceptable
774
+ 772 acceptable
775
+ 773 unacceptable
776
+ 774 acceptable
777
+ 775 unacceptable
778
+ 776 unacceptable
779
+ 777 acceptable
780
+ 778 acceptable
781
+ 779 acceptable
782
+ 780 acceptable
783
+ 781 acceptable
784
+ 782 acceptable
785
+ 783 acceptable
786
+ 784 acceptable
787
+ 785 acceptable
788
+ 786 acceptable
789
+ 787 acceptable
790
+ 788 acceptable
791
+ 789 acceptable
792
+ 790 acceptable
793
+ 791 acceptable
794
+ 792 acceptable
795
+ 793 acceptable
796
+ 794 acceptable
797
+ 795 acceptable
798
+ 796 unacceptable
799
+ 797 acceptable
800
+ 798 unacceptable
801
+ 799 unacceptable
802
+ 800 acceptable
803
+ 801 acceptable
804
+ 802 acceptable
805
+ 803 unacceptable
806
+ 804 unacceptable
807
+ 805 acceptable
808
+ 806 acceptable
809
+ 807 acceptable
810
+ 808 unacceptable
811
+ 809 acceptable
812
+ 810 acceptable
813
+ 811 acceptable
814
+ 812 acceptable
815
+ 813 acceptable
816
+ 814 acceptable
817
+ 815 unacceptable
818
+ 816 acceptable
819
+ 817 acceptable
820
+ 818 acceptable
821
+ 819 acceptable
822
+ 820 unacceptable
823
+ 821 acceptable
824
+ 822 unacceptable
825
+ 823 unacceptable
826
+ 824 acceptable
827
+ 825 unacceptable
828
+ 826 unacceptable
829
+ 827 acceptable
830
+ 828 acceptable
831
+ 829 acceptable
832
+ 830 unacceptable
833
+ 831 unacceptable
834
+ 832 unacceptable
835
+ 833 acceptable
836
+ 834 acceptable
837
+ 835 acceptable
838
+ 836 unacceptable
839
+ 837 acceptable
840
+ 838 acceptable
841
+ 839 acceptable
842
+ 840 acceptable
843
+ 841 unacceptable
844
+ 842 acceptable
845
+ 843 unacceptable
846
+ 844 acceptable
847
+ 845 unacceptable
848
+ 846 unacceptable
849
+ 847 acceptable
850
+ 848 acceptable
851
+ 849 acceptable
852
+ 850 acceptable
853
+ 851 unacceptable
854
+ 852 acceptable
855
+ 853 unacceptable
856
+ 854 acceptable
857
+ 855 acceptable
858
+ 856 acceptable
859
+ 857 acceptable
860
+ 858 unacceptable
861
+ 859 acceptable
862
+ 860 acceptable
863
+ 861 acceptable
864
+ 862 acceptable
865
+ 863 acceptable
866
+ 864 acceptable
867
+ 865 acceptable
868
+ 866 unacceptable
869
+ 867 acceptable
870
+ 868 unacceptable
871
+ 869 acceptable
872
+ 870 unacceptable
873
+ 871 acceptable
874
+ 872 unacceptable
875
+ 873 unacceptable
876
+ 874 acceptable
877
+ 875 acceptable
878
+ 876 acceptable
879
+ 877 unacceptable
880
+ 878 acceptable
881
+ 879 acceptable
882
+ 880 acceptable
883
+ 881 acceptable
884
+ 882 acceptable
885
+ 883 acceptable
886
+ 884 acceptable
887
+ 885 unacceptable
888
+ 886 unacceptable
889
+ 887 unacceptable
890
+ 888 unacceptable
891
+ 889 unacceptable
892
+ 890 unacceptable
893
+ 891 unacceptable
894
+ 892 unacceptable
895
+ 893 acceptable
896
+ 894 acceptable
897
+ 895 acceptable
898
+ 896 acceptable
899
+ 897 unacceptable
900
+ 898 unacceptable
901
+ 899 unacceptable
902
+ 900 acceptable
903
+ 901 acceptable
904
+ 902 acceptable
905
+ 903 acceptable
906
+ 904 unacceptable
907
+ 905 acceptable
908
+ 906 acceptable
909
+ 907 acceptable
910
+ 908 acceptable
911
+ 909 acceptable
912
+ 910 acceptable
913
+ 911 acceptable
914
+ 912 acceptable
915
+ 913 unacceptable
916
+ 914 acceptable
917
+ 915 acceptable
918
+ 916 acceptable
919
+ 917 acceptable
920
+ 918 acceptable
921
+ 919 acceptable
922
+ 920 acceptable
923
+ 921 acceptable
924
+ 922 acceptable
925
+ 923 acceptable
926
+ 924 unacceptable
927
+ 925 acceptable
928
+ 926 acceptable
929
+ 927 acceptable
930
+ 928 acceptable
931
+ 929 unacceptable
932
+ 930 unacceptable
933
+ 931 unacceptable
934
+ 932 unacceptable
935
+ 933 unacceptable
936
+ 934 acceptable
937
+ 935 acceptable
938
+ 936 acceptable
939
+ 937 unacceptable
940
+ 938 unacceptable
941
+ 939 unacceptable
942
+ 940 acceptable
943
+ 941 acceptable
944
+ 942 acceptable
945
+ 943 acceptable
946
+ 944 acceptable
947
+ 945 acceptable
948
+ 946 acceptable
949
+ 947 acceptable
950
+ 948 unacceptable
951
+ 949 unacceptable
952
+ 950 acceptable
953
+ 951 acceptable
954
+ 952 unacceptable
955
+ 953 unacceptable
956
+ 954 acceptable
957
+ 955 unacceptable
958
+ 956 acceptable
959
+ 957 acceptable
960
+ 958 acceptable
961
+ 959 acceptable
962
+ 960 acceptable
963
+ 961 acceptable
964
+ 962 acceptable
965
+ 963 acceptable
966
+ 964 acceptable
967
+ 965 acceptable
968
+ 966 acceptable
969
+ 967 acceptable
970
+ 968 acceptable
971
+ 969 acceptable
972
+ 970 acceptable
973
+ 971 acceptable
974
+ 972 acceptable
975
+ 973 acceptable
976
+ 974 acceptable
977
+ 975 acceptable
978
+ 976 acceptable
979
+ 977 acceptable
980
+ 978 acceptable
981
+ 979 acceptable
982
+ 980 unacceptable
983
+ 981 unacceptable
984
+ 982 unacceptable
985
+ 983 acceptable
986
+ 984 acceptable
987
+ 985 acceptable
988
+ 986 unacceptable
989
+ 987 acceptable
990
+ 988 acceptable
991
+ 989 acceptable
992
+ 990 acceptable
993
+ 991 unacceptable
994
+ 992 acceptable
995
+ 993 acceptable
996
+ 994 acceptable
997
+ 995 acceptable
998
+ 996 acceptable
999
+ 997 acceptable
1000
+ 998 acceptable
1001
+ 999 acceptable
1002
+ 1000 unacceptable
1003
+ 1001 acceptable
1004
+ 1002 acceptable
1005
+ 1003 acceptable
1006
+ 1004 unacceptable
1007
+ 1005 unacceptable
1008
+ 1006 acceptable
1009
+ 1007 unacceptable
1010
+ 1008 acceptable
1011
+ 1009 acceptable
1012
+ 1010 acceptable
1013
+ 1011 acceptable
1014
+ 1012 acceptable
1015
+ 1013 acceptable
1016
+ 1014 acceptable
1017
+ 1015 acceptable
1018
+ 1016 acceptable
1019
+ 1017 acceptable
1020
+ 1018 acceptable
1021
+ 1019 acceptable
1022
+ 1020 unacceptable
1023
+ 1021 acceptable
1024
+ 1022 acceptable
1025
+ 1023 unacceptable
1026
+ 1024 unacceptable
1027
+ 1025 acceptable
1028
+ 1026 acceptable
1029
+ 1027 acceptable
1030
+ 1028 acceptable
1031
+ 1029 unacceptable
1032
+ 1030 unacceptable
1033
+ 1031 acceptable
1034
+ 1032 acceptable
1035
+ 1033 acceptable
1036
+ 1034 unacceptable
1037
+ 1035 unacceptable
1038
+ 1036 unacceptable
1039
+ 1037 acceptable
1040
+ 1038 acceptable
1041
+ 1039 unacceptable
1042
+ 1040 acceptable
1043
+ 1041 unacceptable
1044
+ 1042 unacceptable
1045
+ 1043 unacceptable
1046
+ 1044 acceptable
1047
+ 1045 unacceptable
1048
+ 1046 acceptable
1049
+ 1047 acceptable
1050
+ 1048 unacceptable
1051
+ 1049 unacceptable
1052
+ 1050 acceptable
1053
+ 1051 unacceptable
1054
+ 1052 unacceptable
1055
+ 1053 acceptable
1056
+ 1054 acceptable
1057
+ 1055 acceptable
1058
+ 1056 acceptable
1059
+ 1057 acceptable
1060
+ 1058 unacceptable
1061
+ 1059 acceptable
1062
+ 1060 unacceptable
1063
+ 1061 acceptable
1064
+ 1062 acceptable
train_results.json ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "epoch": 3.0,
3
+ "train_loss": 0.3622648042825917,
4
+ "train_runtime": 157.4171,
5
+ "train_samples": 8551,
6
+ "train_samples_per_second": 162.962,
7
+ "train_steps_per_second": 1.277
8
+ }
trainer_state.json ADDED
@@ -0,0 +1,454 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_metric": 0.5894856058137782,
3
+ "best_model_checkpoint": "./runtime-text-classification/deberta-v3-xsmall-CoLA/checkpoint-134",
4
+ "epoch": 3.0,
5
+ "global_step": 201,
6
+ "is_hyper_param_search": false,
7
+ "is_local_process_zero": true,
8
+ "is_world_process_zero": true,
9
+ "log_history": [
10
+ {
11
+ "epoch": 0.04,
12
+ "learning_rate": 2.5714285714285714e-05,
13
+ "loss": 0.6778,
14
+ "step": 3
15
+ },
16
+ {
17
+ "epoch": 0.09,
18
+ "learning_rate": 5.142857142857143e-05,
19
+ "loss": 0.6609,
20
+ "step": 6
21
+ },
22
+ {
23
+ "epoch": 0.13,
24
+ "learning_rate": 5.998426707136545e-05,
25
+ "loss": 0.6124,
26
+ "step": 9
27
+ },
28
+ {
29
+ "epoch": 0.18,
30
+ "learning_rate": 5.990171431423709e-05,
31
+ "loss": 0.5988,
32
+ "step": 12
33
+ },
34
+ {
35
+ "epoch": 0.22,
36
+ "learning_rate": 5.9748603036792754e-05,
37
+ "loss": 0.5704,
38
+ "step": 15
39
+ },
40
+ {
41
+ "epoch": 0.27,
42
+ "learning_rate": 5.952529453287223e-05,
43
+ "loss": 0.5851,
44
+ "step": 18
45
+ },
46
+ {
47
+ "epoch": 0.31,
48
+ "learning_rate": 5.923231573940778e-05,
49
+ "loss": 0.5969,
50
+ "step": 21
51
+ },
52
+ {
53
+ "epoch": 0.36,
54
+ "learning_rate": 5.887035799302091e-05,
55
+ "loss": 0.5408,
56
+ "step": 24
57
+ },
58
+ {
59
+ "epoch": 0.4,
60
+ "learning_rate": 5.844027539868812e-05,
61
+ "loss": 0.5148,
62
+ "step": 27
63
+ },
64
+ {
65
+ "epoch": 0.45,
66
+ "learning_rate": 5.794308281432527e-05,
67
+ "loss": 0.4907,
68
+ "step": 30
69
+ },
70
+ {
71
+ "epoch": 0.49,
72
+ "learning_rate": 5.7379953456046206e-05,
73
+ "loss": 0.4503,
74
+ "step": 33
75
+ },
76
+ {
77
+ "epoch": 0.54,
78
+ "learning_rate": 5.675221612974643e-05,
79
+ "loss": 0.4701,
80
+ "step": 36
81
+ },
82
+ {
83
+ "epoch": 0.58,
84
+ "learning_rate": 5.606135209554454e-05,
85
+ "loss": 0.449,
86
+ "step": 39
87
+ },
88
+ {
89
+ "epoch": 0.63,
90
+ "learning_rate": 5.530899157248014e-05,
91
+ "loss": 0.4227,
92
+ "step": 42
93
+ },
94
+ {
95
+ "epoch": 0.67,
96
+ "learning_rate": 5.449690989171633e-05,
97
+ "loss": 0.3914,
98
+ "step": 45
99
+ },
100
+ {
101
+ "epoch": 0.72,
102
+ "learning_rate": 5.3627023307323634e-05,
103
+ "loss": 0.4338,
104
+ "step": 48
105
+ },
106
+ {
107
+ "epoch": 0.76,
108
+ "learning_rate": 5.2701384474530855e-05,
109
+ "loss": 0.3944,
110
+ "step": 51
111
+ },
112
+ {
113
+ "epoch": 0.81,
114
+ "learning_rate": 5.172217760611265e-05,
115
+ "loss": 0.4302,
116
+ "step": 54
117
+ },
118
+ {
119
+ "epoch": 0.85,
120
+ "learning_rate": 5.0691713318343134e-05,
121
+ "loss": 0.4251,
122
+ "step": 57
123
+ },
124
+ {
125
+ "epoch": 0.9,
126
+ "learning_rate": 4.961242317867758e-05,
127
+ "loss": 0.3713,
128
+ "step": 60
129
+ },
130
+ {
131
+ "epoch": 0.94,
132
+ "learning_rate": 4.848685396802782e-05,
133
+ "loss": 0.4146,
134
+ "step": 63
135
+ },
136
+ {
137
+ "epoch": 0.99,
138
+ "learning_rate": 4.731766167117059e-05,
139
+ "loss": 0.3945,
140
+ "step": 66
141
+ },
142
+ {
143
+ "epoch": 1.0,
144
+ "eval_loss": 0.43225371837615967,
145
+ "eval_matthews_correlation": 0.5778184033685675,
146
+ "eval_runtime": 5.0494,
147
+ "eval_samples_per_second": 206.558,
148
+ "eval_steps_per_second": 51.689,
149
+ "step": 67
150
+ },
151
+ {
152
+ "epoch": 1.03,
153
+ "learning_rate": 4.610760520946952e-05,
154
+ "loss": 0.3873,
155
+ "step": 69
156
+ },
157
+ {
158
+ "epoch": 1.07,
159
+ "learning_rate": 4.4859539930699636e-05,
160
+ "loss": 0.33,
161
+ "step": 72
162
+ },
163
+ {
164
+ "epoch": 1.12,
165
+ "learning_rate": 4.357641087133617e-05,
166
+ "loss": 0.3265,
167
+ "step": 75
168
+ },
169
+ {
170
+ "epoch": 1.16,
171
+ "learning_rate": 4.226124580720669e-05,
172
+ "loss": 0.3306,
173
+ "step": 78
174
+ },
175
+ {
176
+ "epoch": 1.21,
177
+ "learning_rate": 4.091714810890463e-05,
178
+ "loss": 0.3695,
179
+ "step": 81
180
+ },
181
+ {
182
+ "epoch": 1.25,
183
+ "learning_rate": 3.9547289418823325e-05,
184
+ "loss": 0.3862,
185
+ "step": 84
186
+ },
187
+ {
188
+ "epoch": 1.3,
189
+ "learning_rate": 3.815490216709029e-05,
190
+ "loss": 0.3557,
191
+ "step": 87
192
+ },
193
+ {
194
+ "epoch": 1.34,
195
+ "learning_rate": 3.6743271944061884e-05,
196
+ "loss": 0.2995,
197
+ "step": 90
198
+ },
199
+ {
200
+ "epoch": 1.39,
201
+ "learning_rate": 3.5315729747376686e-05,
202
+ "loss": 0.2953,
203
+ "step": 93
204
+ },
205
+ {
206
+ "epoch": 1.43,
207
+ "learning_rate": 3.3875644121862195e-05,
208
+ "loss": 0.3356,
209
+ "step": 96
210
+ },
211
+ {
212
+ "epoch": 1.48,
213
+ "learning_rate": 3.242641321084213e-05,
214
+ "loss": 0.3182,
215
+ "step": 99
216
+ },
217
+ {
218
+ "epoch": 1.52,
219
+ "learning_rate": 3.097145673760068e-05,
220
+ "loss": 0.358,
221
+ "step": 102
222
+ },
223
+ {
224
+ "epoch": 1.57,
225
+ "learning_rate": 2.9514207935924957e-05,
226
+ "loss": 0.3351,
227
+ "step": 105
228
+ },
229
+ {
230
+ "epoch": 1.61,
231
+ "learning_rate": 2.805810544876693e-05,
232
+ "loss": 0.3057,
233
+ "step": 108
234
+ },
235
+ {
236
+ "epoch": 1.66,
237
+ "learning_rate": 2.6606585214141475e-05,
238
+ "loss": 0.3138,
239
+ "step": 111
240
+ },
241
+ {
242
+ "epoch": 1.7,
243
+ "learning_rate": 2.5163072357407205e-05,
244
+ "loss": 0.335,
245
+ "step": 114
246
+ },
247
+ {
248
+ "epoch": 1.75,
249
+ "learning_rate": 2.373097310906175e-05,
250
+ "loss": 0.3209,
251
+ "step": 117
252
+ },
253
+ {
254
+ "epoch": 1.79,
255
+ "learning_rate": 2.231366676712283e-05,
256
+ "loss": 0.3483,
257
+ "step": 120
258
+ },
259
+ {
260
+ "epoch": 1.84,
261
+ "learning_rate": 2.0914497723061486e-05,
262
+ "loss": 0.2824,
263
+ "step": 123
264
+ },
265
+ {
266
+ "epoch": 1.88,
267
+ "learning_rate": 1.953676757010353e-05,
268
+ "loss": 0.2709,
269
+ "step": 126
270
+ },
271
+ {
272
+ "epoch": 1.93,
273
+ "learning_rate": 1.8183727312521392e-05,
274
+ "loss": 0.3404,
275
+ "step": 129
276
+ },
277
+ {
278
+ "epoch": 1.97,
279
+ "learning_rate": 1.685856969429953e-05,
280
+ "loss": 0.3214,
281
+ "step": 132
282
+ },
283
+ {
284
+ "epoch": 2.0,
285
+ "eval_loss": 0.423650860786438,
286
+ "eval_matthews_correlation": 0.5894856058137782,
287
+ "eval_runtime": 5.1798,
288
+ "eval_samples_per_second": 201.361,
289
+ "eval_steps_per_second": 50.388,
290
+ "step": 134
291
+ },
292
+ {
293
+ "epoch": 2.01,
294
+ "learning_rate": 1.556442166527585e-05,
295
+ "loss": 0.2703,
296
+ "step": 135
297
+ },
298
+ {
299
+ "epoch": 2.06,
300
+ "learning_rate": 1.4304337002536097e-05,
301
+ "loss": 0.2356,
302
+ "step": 138
303
+ },
304
+ {
305
+ "epoch": 2.1,
306
+ "learning_rate": 1.3081289104472803e-05,
307
+ "loss": 0.2812,
308
+ "step": 141
309
+ },
310
+ {
311
+ "epoch": 2.15,
312
+ "learning_rate": 1.189816397451226e-05,
313
+ "loss": 0.2759,
314
+ "step": 144
315
+ },
316
+ {
317
+ "epoch": 2.19,
318
+ "learning_rate": 1.075775341106581e-05,
319
+ "loss": 0.25,
320
+ "step": 147
321
+ },
322
+ {
323
+ "epoch": 2.24,
324
+ "learning_rate": 9.662748419774903e-06,
325
+ "loss": 0.3233,
326
+ "step": 150
327
+ },
328
+ {
329
+ "epoch": 2.28,
330
+ "learning_rate": 8.61573286359513e-06,
331
+ "loss": 0.2499,
332
+ "step": 153
333
+ },
334
+ {
335
+ "epoch": 2.33,
336
+ "learning_rate": 7.619177365702619e-06,
337
+ "loss": 0.2734,
338
+ "step": 156
339
+ },
340
+ {
341
+ "epoch": 2.37,
342
+ "learning_rate": 6.6754334796105274e-06,
343
+ "loss": 0.2456,
344
+ "step": 159
345
+ },
346
+ {
347
+ "epoch": 2.42,
348
+ "learning_rate": 5.786728140251719e-06,
349
+ "loss": 0.2782,
350
+ "step": 162
351
+ },
352
+ {
353
+ "epoch": 2.46,
354
+ "learning_rate": 4.95515840912187e-06,
355
+ "loss": 0.248,
356
+ "step": 165
357
+ },
358
+ {
359
+ "epoch": 2.51,
360
+ "learning_rate": 4.182686525882242e-06,
361
+ "loss": 0.2766,
362
+ "step": 168
363
+ },
364
+ {
365
+ "epoch": 2.55,
366
+ "learning_rate": 3.4711352780992968e-06,
367
+ "loss": 0.2192,
368
+ "step": 171
369
+ },
370
+ {
371
+ "epoch": 2.6,
372
+ "learning_rate": 2.822183700046593e-06,
373
+ "loss": 0.1969,
374
+ "step": 174
375
+ },
376
+ {
377
+ "epoch": 2.64,
378
+ "learning_rate": 2.237363110718876e-06,
379
+ "loss": 0.2931,
380
+ "step": 177
381
+ },
382
+ {
383
+ "epoch": 2.69,
384
+ "learning_rate": 1.718053500406972e-06,
385
+ "loss": 0.2551,
386
+ "step": 180
387
+ },
388
+ {
389
+ "epoch": 2.73,
390
+ "learning_rate": 1.2654802743603888e-06,
391
+ "loss": 0.246,
392
+ "step": 183
393
+ },
394
+ {
395
+ "epoch": 2.78,
396
+ "learning_rate": 8.807113612212248e-07,
397
+ "loss": 0.2474,
398
+ "step": 186
399
+ },
400
+ {
401
+ "epoch": 2.82,
402
+ "learning_rate": 5.646546930528284e-07,
403
+ "loss": 0.2691,
404
+ "step": 189
405
+ },
406
+ {
407
+ "epoch": 2.87,
408
+ "learning_rate": 3.1805606290931987e-07,
409
+ "loss": 0.3154,
410
+ "step": 192
411
+ },
412
+ {
413
+ "epoch": 2.91,
414
+ "learning_rate": 1.414973650015816e-07,
415
+ "loss": 0.2823,
416
+ "step": 195
417
+ },
418
+ {
419
+ "epoch": 2.96,
420
+ "learning_rate": 3.5395221612279924e-08,
421
+ "loss": 0.2711,
422
+ "step": 198
423
+ },
424
+ {
425
+ "epoch": 3.0,
426
+ "learning_rate": 0.0,
427
+ "loss": 0.3059,
428
+ "step": 201
429
+ },
430
+ {
431
+ "epoch": 3.0,
432
+ "eval_loss": 0.4636174738407135,
433
+ "eval_matthews_correlation": 0.5794528111058918,
434
+ "eval_runtime": 5.0259,
435
+ "eval_samples_per_second": 207.524,
436
+ "eval_steps_per_second": 51.931,
437
+ "step": 201
438
+ },
439
+ {
440
+ "epoch": 3.0,
441
+ "step": 201,
442
+ "total_flos": 422473413165056.0,
443
+ "train_loss": 0.3622648042825917,
444
+ "train_runtime": 157.4171,
445
+ "train_samples_per_second": 162.962,
446
+ "train_steps_per_second": 1.277
447
+ }
448
+ ],
449
+ "max_steps": 201,
450
+ "num_train_epochs": 3,
451
+ "total_flos": 422473413165056.0,
452
+ "trial_name": null,
453
+ "trial_params": null
454
+ }