Training in progress, step 9320

Files changed (3) hide show

all_results.json ADDED Viewed

+{
+    "before_init_mem_cpu": 1174028288,
+    "before_init_mem_gpu": 0,
+    "epoch": 19.35,
+    "init_mem_cpu_alloc_delta": 2783887360,
+    "init_mem_cpu_peaked_delta": 414412800,
+    "init_mem_gpu_alloc_delta": 497994240,
+    "init_mem_gpu_peaked_delta": 512,
+    "train_loss": 0.2542688299146333,
+    "train_mem_cpu_alloc_delta": 8443502592,
+    "train_mem_cpu_peaked_delta": 383119360,
+    "train_mem_gpu_alloc_delta": 2006973440,
+    "train_mem_gpu_peaked_delta": 15468135424,
+    "train_runtime": 73469.8819,
+    "train_samples": 3825056,
+    "train_samples_per_second": 1041.258,
+    "train_steps_per_second": 0.127
+}

train_results.json ADDED Viewed

+{
+    "before_init_mem_cpu": 1174028288,
+    "before_init_mem_gpu": 0,
+    "epoch": 19.35,
+    "init_mem_cpu_alloc_delta": 2783887360,
+    "init_mem_cpu_peaked_delta": 414412800,
+    "init_mem_gpu_alloc_delta": 497994240,
+    "init_mem_gpu_peaked_delta": 512,
+    "train_loss": 0.2542688299146333,
+    "train_mem_cpu_alloc_delta": 8443502592,
+    "train_mem_cpu_peaked_delta": 383119360,
+    "train_mem_gpu_alloc_delta": 2006973440,
+    "train_mem_gpu_peaked_delta": 15468135424,
+    "train_runtime": 73469.8819,
+    "train_samples": 3825056,
+    "train_samples_per_second": 1041.258,
+    "train_steps_per_second": 0.127
+}

trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff