Training in progress, step 16

Browse files

Files changed (13) hide show

.gitignore +1 -0
last-checkpoint/global_step16/mp_rank_00_model_states.pt +3 -0
last-checkpoint/latest +1 -0
last-checkpoint/pytorch_model.bin +3 -0
last-checkpoint/rng_state.pth +3 -0
last-checkpoint/trainer_state.json +72 -0
last-checkpoint/training_args.bin +3 -0
pytorch_model.bin +3 -0
runs/May07_10-21-27_4b70004df776/1683455005.2091758/events.out.tfevents.1683455005.4b70004df776.3696.1 +3 -0
runs/May07_10-21-27_4b70004df776/events.out.tfevents.1683455005.4b70004df776.3696.0 +3 -0
runs/May07_10-28-14_4b70004df776/1683455317.7778356/events.out.tfevents.1683455317.4b70004df776.5727.1 +3 -0
runs/May07_10-28-14_4b70004df776/events.out.tfevents.1683455317.4b70004df776.5727.0 +3 -0
training_args.bin +3 -0

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ checkpoint-*/

last-checkpoint/global_step16/mp_rank_00_model_states.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8248d55428725c8bb343f19acd50595a7f3f12861f568fb6e6817bedd8c43e1
+size 610143229

last-checkpoint/latest ADDED Viewed

	@@ -0,0 +1 @@


1	+ global_step16

last-checkpoint/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:20f5c5d9336a98e819ce08f74b1e04456d99a025bc8fa11cb7c891364f03c2f3
+size 601880905

last-checkpoint/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c6bb867ea9a5e3cb0801d1f1f898b34196647e594bdb5c684789cca6b3f060e
+size 14575

last-checkpoint/trainer_state.json ADDED Viewed

	@@ -0,0 +1,72 @@

+{
+  "best_metric": 10.5859375,
+  "best_model_checkpoint": "./output/checkpoint-8",
+  "epoch": 0.3395225464190981,
+  "global_step": 16,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "learning_rate": 0,
+      "loss": 0.0,
+      "step": 1
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 0,
+      "loss": 0.0,
+      "step": 4
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 0,
+      "loss": 0.0,
+      "step": 8
+    },
+    {
+      "epoch": 0.17,
+      "eval_gen_len": 164.125,
+      "eval_loss": 10.5859375,
+      "eval_rouge1": 24.167,
+      "eval_rouge2": 7.6936,
+      "eval_rougeL": 17.9025,
+      "eval_rougeLsum": 18.0915,
+      "eval_runtime": 67.149,
+      "eval_samples_per_second": 0.119,
+      "eval_steps_per_second": 0.03,
+      "step": 8
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0,
+      "loss": 0.0,
+      "step": 12
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 0,
+      "loss": 0.0,
+      "step": 16
+    },
+    {
+      "epoch": 0.34,
+      "eval_gen_len": 164.125,
+      "eval_loss": 10.5859375,
+      "eval_rouge1": 24.5587,
+      "eval_rouge2": 7.7531,
+      "eval_rougeL": 18.153,
+      "eval_rougeLsum": 18.3692,
+      "eval_runtime": 67.4414,
+      "eval_samples_per_second": 0.119,
+      "eval_steps_per_second": 0.03,
+      "step": 16
+    }
+  ],
+  "max_steps": 188,
+  "num_train_epochs": 4,
+  "total_flos": 203851630116864.0,
+  "trial_name": null,
+  "trial_params": null
+}

last-checkpoint/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:273daabbee6a1697c84fbe312719df2d9bd01849397a7cb95859c3baac61b930
+size 4731

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:20f5c5d9336a98e819ce08f74b1e04456d99a025bc8fa11cb7c891364f03c2f3
+size 601880905

runs/May07_10-21-27_4b70004df776/1683455005.2091758/events.out.tfevents.1683455005.4b70004df776.3696.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:466447c323c5730719b1d83fbda6e22058f184e5b1ee48b71cd29b1bebb0bf19
+size 6163

runs/May07_10-21-27_4b70004df776/events.out.tfevents.1683455005.4b70004df776.3696.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:88e14f3241a91d05f4528347cfa96f5e0506d47ded689ba8996513c0e810b1f6
+size 5292

runs/May07_10-28-14_4b70004df776/1683455317.7778356/events.out.tfevents.1683455317.4b70004df776.5727.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:232f773ea29bde9ce7b2bb8432f911d1a3cdb2ac362c54f421018e95e240ed1c
+size 6163

runs/May07_10-28-14_4b70004df776/events.out.tfevents.1683455317.4b70004df776.5727.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8eb3690c4a47304851554a641e97b1815c900665d8c301431e6b2bf44d4b7efb
+size 5140

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:273daabbee6a1697c84fbe312719df2d9bd01849397a7cb95859c3baac61b930
+size 4731