Training in progress, step 450000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Nov21_18-14-51_t1v-n-088af867-w-0/events.out.tfevents.1669054551.t1v-n-088af867-w-0.42571.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4a8d3f36939737ae0aaa306b30713bc930912d9918feb638fe2b39f489502101
 size 996067161

 version https://git-lfs.github.com/spec/v1
+oid sha256:6ba2e5635ae62755b90cdcc32d650dd4aa5b58a96d597367f382ffd6d853ee7c
 size 996067161

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b33af7f385b01380e65f7aeb80aa12e4383a2169070de79dfba96292f80f4d8
 size 498046827

 version https://git-lfs.github.com/spec/v1
+oid sha256:20232404bfb636cdcb236784844b3b34641dcf65847a7c18f6cf3bba4aec24ac
 size 498046827

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b6696b8b378624a05a2eed7725353c1adf6d42d17ddb3c5aca0356a885e6f92
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:2580358dc0ce3a58282b9640237be6a42cb87e949331a40a578d2b7299cf3a33
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:09a9c9a1473cf0b80ceefef43d01c906fb43bb121e1fc13f1e6c26e124498b2e
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:94d1e4cb0f316512e56b6c3b47290d69f85a3d2dd3b9f1c9bba71917eb5f64b5
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b6696b8b378624a05a2eed7725353c1adf6d42d17ddb3c5aca0356a885e6f92
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:2580358dc0ce3a58282b9640237be6a42cb87e949331a40a578d2b7299cf3a33
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c42209a458371bd6d13ab96e2b988016f51d766214bf95f12f769a6db7dc5a7a
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce1d97cb92c41460b91f8862e191bc910bc6f2d4cfa4e90de3011073db73c32c
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db8dc14cbf0a253ea1742cfa025ce44f6b0624fc84501d6e783116bbb28e4533
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:cac709e6780e4e7e8c1c4cfd36f41c62972f9ff69fa99912d6332a7db930c7b1
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c42209a458371bd6d13ab96e2b988016f51d766214bf95f12f769a6db7dc5a7a
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce1d97cb92c41460b91f8862e191bc910bc6f2d4cfa4e90de3011073db73c32c
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db8dc14cbf0a253ea1742cfa025ce44f6b0624fc84501d6e783116bbb28e4533
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:cac709e6780e4e7e8c1c4cfd36f41c62972f9ff69fa99912d6332a7db930c7b1
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b6696b8b378624a05a2eed7725353c1adf6d42d17ddb3c5aca0356a885e6f92
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:2580358dc0ce3a58282b9640237be6a42cb87e949331a40a578d2b7299cf3a33
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3e4ecef8b58c710458716a0153f8519567dd2a15c4728bc445f0af4d3fb15782
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:78e735efa7e40e0dd22dcac5cb3724b0cbe120563d603ea4b62f22b0f40fc602
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.13296,
-  "global_step": 400000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2470,11 +2470,319 @@
       "eval_samples_per_second": 515.376,
       "eval_steps_per_second": 2.062,
       "step": 400000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
-  "total_flos": 6.739566595460825e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.18296,
+  "global_step": 450000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 515.376,
       "eval_steps_per_second": 2.062,
       "step": 400000
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 6.993324133116726e-05,
+      "loss": 0.8688,
+      "step": 401000
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 6.978149344295242e-05,
+      "loss": 0.8657,
+      "step": 402000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.962952922749457e-05,
+      "loss": 0.8678,
+      "step": 403000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.947735034665002e-05,
+      "loss": 0.8624,
+      "step": 404000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.932495846462261e-05,
+      "loss": 0.8719,
+      "step": 405000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.917235524794558e-05,
+      "loss": 0.8697,
+      "step": 406000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.901954236546323e-05,
+      "loss": 0.8751,
+      "step": 407000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.886652148831279e-05,
+      "loss": 0.8507,
+      "step": 408000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.871329428990602e-05,
+      "loss": 0.8562,
+      "step": 409000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.855986244591104e-05,
+      "loss": 0.8542,
+      "step": 410000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.840622763423391e-05,
+      "loss": 0.8531,
+      "step": 411000
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 6.825239153500029e-05,
+      "loss": 0.871,
+      "step": 412000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.809835583053715e-05,
+      "loss": 0.8552,
+      "step": 413000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.794412220535426e-05,
+      "loss": 0.8555,
+      "step": 414000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.778969234612584e-05,
+      "loss": 0.8487,
+      "step": 415000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.763506794167208e-05,
+      "loss": 0.8603,
+      "step": 416000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.748025068294067e-05,
+      "loss": 0.8627,
+      "step": 417000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.732524226298841e-05,
+      "loss": 0.8568,
+      "step": 418000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.71700443769625e-05,
+      "loss": 0.8531,
+      "step": 419000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.701465872208216e-05,
+      "loss": 0.8598,
+      "step": 420000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.685908699762002e-05,
+      "loss": 0.8603,
+      "step": 421000
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 6.670333090488356e-05,
+      "loss": 0.854,
+      "step": 422000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.654739214719641e-05,
+      "loss": 0.8486,
+      "step": 423000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.639127242987988e-05,
+      "loss": 0.8588,
+      "step": 424000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.623497346023418e-05,
+      "loss": 0.8589,
+      "step": 425000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.607849694751977e-05,
+      "loss": 0.8547,
+      "step": 426000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.592184460293877e-05,
+      "loss": 0.8442,
+      "step": 427000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.576501813961609e-05,
+      "loss": 0.8554,
+      "step": 428000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.56080192725808e-05,
+      "loss": 0.8609,
+      "step": 429000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.545084971874738e-05,
+      "loss": 0.861,
+      "step": 430000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.529351119689688e-05,
+      "loss": 0.8529,
+      "step": 431000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 6.513600542765817e-05,
+      "loss": 0.8636,
+      "step": 432000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.497833413348909e-05,
+      "loss": 0.8775,
+      "step": 433000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.48204990386577e-05,
+      "loss": 0.8544,
+      "step": 434000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.466250186922325e-05,
+      "loss": 0.8497,
+      "step": 435000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.450434435301751e-05,
+      "loss": 0.8549,
+      "step": 436000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.43460282196257e-05,
+      "loss": 0.8598,
+      "step": 437000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.418755520036775e-05,
+      "loss": 0.8671,
+      "step": 438000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.402892702827916e-05,
+      "loss": 0.8656,
+      "step": 439000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.387014543809223e-05,
+      "loss": 0.8606,
+      "step": 440000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.371121216621698e-05,
+      "loss": 0.8489,
+      "step": 441000
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 6.355212895072223e-05,
+      "loss": 0.8729,
+      "step": 442000
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 6.339289753131649e-05,
+      "loss": 0.8528,
+      "step": 443000
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 6.323351964932908e-05,
+      "loss": 0.8608,
+      "step": 444000
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 6.307399704769099e-05,
+      "loss": 0.8586,
+      "step": 445000
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 6.291433147091583e-05,
+      "loss": 0.8612,
+      "step": 446000
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 6.275452466508077e-05,
+      "loss": 0.8653,
+      "step": 447000
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 6.259457837780742e-05,
+      "loss": 0.8611,
+      "step": 448000
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 6.243449435824276e-05,
+      "loss": 0.8493,
+      "step": 449000
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 6.227427435703997e-05,
+      "loss": 0.856,
+      "step": 450000
+    },
+    {
+      "epoch": 1.18,
+      "eval_loss": 0.8140913248062134,
+      "eval_runtime": 19.7177,
+      "eval_samples_per_second": 507.158,
+      "eval_steps_per_second": 2.029,
+      "step": 450000
     }
   ],
   "max_steps": 1000000,
   "num_train_epochs": 9223372036854775807,
+  "total_flos": 7.582013472952025e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b33af7f385b01380e65f7aeb80aa12e4383a2169070de79dfba96292f80f4d8
 size 498046827

 version https://git-lfs.github.com/spec/v1
+oid sha256:20232404bfb636cdcb236784844b3b34641dcf65847a7c18f6cf3bba4aec24ac
 size 498046827

runs/Nov21_18-14-51_t1v-n-088af867-w-0/events.out.tfevents.1669054551.t1v-n-088af867-w-0.42571.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ead0e127165612cd6c7a91f6d456c0b9192133ad266c2421f2883cdc9921339d
-size 20300

 version https://git-lfs.github.com/spec/v1
+oid sha256:c6e41df2cffbbd747c918699889d1f687a6f889fb0a5f56e479d061233d479b7
+size 28576