Training in progress, epoch 150, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +268 -4

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b1b050b46f4abbe104a662b3e7daff91ad7aa7b0dc5b6b45c2c1e21223b9dd9a
 size 166496880

 version https://git-lfs.github.com/spec/v1
+oid sha256:e02a36bcf38ef6771ea1c0be938289226a5fe98c33ab1d85ca8a1ca855bb867c
 size 166496880

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90435ff37114bd6582ded1147a5d07d469037df489412cd78505236316b1afb6
 size 330495866

 version https://git-lfs.github.com/spec/v1
+oid sha256:416afdc0dbed0a1c50117e8afe577bcc73b29c9418c1d3ed682cff01eb911523
 size 330495866

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74ff39ce5bc1f6039b31922a6e443ab8d8a8f93d5528fc0d576340ae329fb493
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:ceefbb484abd4ed8dc8842b1277aaf2814ba0b1602ab48247135b7cfe2173c79
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eb678f76da1c9347406d38fe82346b2ac3acd84e6118cb46f17ee79a3da28612
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:531fa53bf2bb93608e8c8228dd565bd5fe95292cd882c1935da101ac5d413c48
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 0.23615802824497223,
   "best_model_checkpoint": "chickens-composite-403232323232-150-epochs-w-transform-metrics-test/checkpoint-123000",
-  "epoch": 149.0,
   "eval_steps": 500,
-  "global_step": 149000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -38643,6 +38643,270 @@
       "eval_samples_per_second": 15.14,
       "eval_steps_per_second": 1.893,
       "step": 149000
     }
   ],
   "logging_steps": 30,
@@ -38657,12 +38921,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 5.12594438234112e+19,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 0.23615802824497223,
   "best_model_checkpoint": "chickens-composite-403232323232-150-epochs-w-transform-metrics-test/checkpoint-123000",
+  "epoch": 150.0,
   "eval_steps": 500,
+  "global_step": 150000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 15.14,
       "eval_steps_per_second": 1.893,
       "step": 149000
+    },
+    {
+      "epoch": 149.01,
+      "grad_norm": 54.10673141479492,
+      "learning_rate": 1.074761413334957e-09,
+      "loss": 0.3406,
+      "step": 149010
+    },
+    {
+      "epoch": 149.04,
+      "grad_norm": 151.46478271484375,
+      "learning_rate": 1.0106134441850712e-09,
+      "loss": 0.2945,
+      "step": 149040
+    },
+    {
+      "epoch": 149.07,
+      "grad_norm": 34.716007232666016,
+      "learning_rate": 9.484389968766882e-10,
+      "loss": 0.3195,
+      "step": 149070
+    },
+    {
+      "epoch": 149.1,
+      "grad_norm": 45.507484436035156,
+      "learning_rate": 8.88238095955174e-10,
+      "loss": 0.2918,
+      "step": 149100
+    },
+    {
+      "epoch": 149.13,
+      "grad_norm": 36.53764724731445,
+      "learning_rate": 8.300107651859623e-10,
+      "loss": 0.3201,
+      "step": 149130
+    },
+    {
+      "epoch": 149.16,
+      "grad_norm": 83.43916320800781,
+      "learning_rate": 7.737570275573314e-10,
+      "loss": 0.2829,
+      "step": 149160
+    },
+    {
+      "epoch": 149.19,
+      "grad_norm": 32.47480773925781,
+      "learning_rate": 7.194769052765171e-10,
+      "loss": 0.354,
+      "step": 149190
+    },
+    {
+      "epoch": 149.22,
+      "grad_norm": 33.71446990966797,
+      "learning_rate": 6.671704197735995e-10,
+      "loss": 0.2461,
+      "step": 149220
+    },
+    {
+      "epoch": 149.25,
+      "grad_norm": 60.157772064208984,
+      "learning_rate": 6.168375916970615e-10,
+      "loss": 0.2918,
+      "step": 149250
+    },
+    {
+      "epoch": 149.28,
+      "grad_norm": 36.07717514038086,
+      "learning_rate": 5.684784409182298e-10,
+      "loss": 0.4074,
+      "step": 149280
+    },
+    {
+      "epoch": 149.31,
+      "grad_norm": 87.16706085205078,
+      "learning_rate": 5.220929865284996e-10,
+      "loss": 0.3109,
+      "step": 149310
+    },
+    {
+      "epoch": 149.34,
+      "grad_norm": 51.461036682128906,
+      "learning_rate": 4.776812468398895e-10,
+      "loss": 0.3124,
+      "step": 149340
+    },
+    {
+      "epoch": 149.37,
+      "grad_norm": 53.12019729614258,
+      "learning_rate": 4.3524323938559655e-10,
+      "loss": 0.26,
+      "step": 149370
+    },
+    {
+      "epoch": 149.4,
+      "grad_norm": 31.98765754699707,
+      "learning_rate": 3.9477898091944135e-10,
+      "loss": 0.2911,
+      "step": 149400
+    },
+    {
+      "epoch": 149.43,
+      "grad_norm": 45.87418746948242,
+      "learning_rate": 3.562884874158679e-10,
+      "loss": 0.3493,
+      "step": 149430
+    },
+    {
+      "epoch": 149.46,
+      "grad_norm": 50.62438201904297,
+      "learning_rate": 3.1977177407105376e-10,
+      "loss": 0.3425,
+      "step": 149460
+    },
+    {
+      "epoch": 149.49,
+      "grad_norm": 118.38064575195312,
+      "learning_rate": 2.8522885530013475e-10,
+      "loss": 0.4231,
+      "step": 149490
+    },
+    {
+      "epoch": 149.52,
+      "grad_norm": 50.225257873535156,
+      "learning_rate": 2.5265974474109054e-10,
+      "loss": 0.2677,
+      "step": 149520
+    },
+    {
+      "epoch": 149.55,
+      "grad_norm": 253.9156951904297,
+      "learning_rate": 2.2206445525085886e-10,
+      "loss": 0.3737,
+      "step": 149550
+    },
+    {
+      "epoch": 149.58,
+      "grad_norm": 46.01321029663086,
+      "learning_rate": 1.9344299890866614e-10,
+      "loss": 0.4259,
+      "step": 149580
+    },
+    {
+      "epoch": 149.61,
+      "grad_norm": 127.60037994384766,
+      "learning_rate": 1.6679538701325215e-10,
+      "loss": 0.3044,
+      "step": 149610
+    },
+    {
+      "epoch": 149.64,
+      "grad_norm": 74.46773529052734,
+      "learning_rate": 1.4212163008509028e-10,
+      "loss": 0.3339,
+      "step": 149640
+    },
+    {
+      "epoch": 149.67,
+      "grad_norm": 92.41695404052734,
+      "learning_rate": 1.1942173786527732e-10,
+      "loss": 0.285,
+      "step": 149670
+    },
+    {
+      "epoch": 149.7,
+      "grad_norm": 43.35792541503906,
+      "learning_rate": 9.869571931442334e-11,
+      "loss": 0.3565,
+      "step": 149700
+    },
+    {
+      "epoch": 149.73,
+      "grad_norm": 63.197906494140625,
+      "learning_rate": 7.994358261542712e-11,
+      "loss": 0.2996,
+      "step": 149730
+    },
+    {
+      "epoch": 149.76,
+      "grad_norm": 38.37726974487305,
+      "learning_rate": 6.316533517125578e-11,
+      "loss": 0.2403,
+      "step": 149760
+    },
+    {
+      "epoch": 149.79,
+      "grad_norm": 30.22950553894043,
+      "learning_rate": 4.83609836054999e-11,
+      "loss": 0.2904,
+      "step": 149790
+    },
+    {
+      "epoch": 149.82,
+      "grad_norm": 50.76008987426758,
+      "learning_rate": 3.55305337634837e-11,
+      "loss": 0.3492,
+      "step": 149820
+    },
+    {
+      "epoch": 149.85,
+      "grad_norm": 64.36622619628906,
+      "learning_rate": 2.467399070893439e-11,
+      "loss": 0.3102,
+      "step": 149850
+    },
+    {
+      "epoch": 149.88,
+      "grad_norm": 34.911922454833984,
+      "learning_rate": 1.57913587295333e-11,
+      "loss": 0.2852,
+      "step": 149880
+    },
+    {
+      "epoch": 149.91,
+      "grad_norm": 77.51419067382812,
+      "learning_rate": 8.882641330809627e-12,
+      "loss": 0.3452,
+      "step": 149910
+    },
+    {
+      "epoch": 149.94,
+      "grad_norm": 37.67948532104492,
+      "learning_rate": 3.947841241136452e-12,
+      "loss": 0.2644,
+      "step": 149940
+    },
+    {
+      "epoch": 149.97,
+      "grad_norm": 105.01229095458984,
+      "learning_rate": 9.869604078449612e-13,
+      "loss": 0.3033,
+      "step": 149970
+    },
+    {
+      "epoch": 150.0,
+      "grad_norm": 62.513954162597656,
+      "learning_rate": 0.0,
+      "loss": 0.2848,
+      "step": 150000
+    },
+    {
+      "epoch": 150.0,
+      "eval_loss": 0.23936401307582855,
+      "eval_map": 0.8413,
+      "eval_map_50": 0.9641,
+      "eval_map_75": 0.9341,
+      "eval_map_chicken": 0.8309,
+      "eval_map_duck": 0.7956,
+      "eval_map_large": 0.8507,
+      "eval_map_medium": 0.8408,
+      "eval_map_plant": 0.8973,
+      "eval_map_small": 0.3268,
+      "eval_mar_1": 0.3376,
+      "eval_mar_10": 0.8711,
+      "eval_mar_100": 0.8749,
+      "eval_mar_100_chicken": 0.8738,
+      "eval_mar_100_duck": 0.8294,
+      "eval_mar_100_plant": 0.9215,
+      "eval_mar_large": 0.881,
+      "eval_mar_medium": 0.8792,
+      "eval_mar_small": 0.3947,
+      "eval_runtime": 14.2916,
+      "eval_samples_per_second": 13.994,
+      "eval_steps_per_second": 1.749,
+      "step": 150000
     }
   ],
   "logging_steps": 30,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 5.160346693632e+19,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null