Test passed

Browse files

Files changed (15) hide show

all_results.json +14 -14
config.json +16 -32
eval_results.json +5 -5
preprocessor_config.json +10 -11
pytorch_model.bin +2 -2
runs/Aug31_13-25-03_surveily-ag-02/events.out.tfevents.1693481104.surveily-ag-02.6684.0 +3 -0
runs/Aug31_13-25-03_surveily-ag-02/events.out.tfevents.1693481674.surveily-ag-02.6684.1 +3 -0
runs/Aug31_13-43-24_surveily-ag-02/events.out.tfevents.1693482204.surveily-ag-02.6684.2 +3 -0
runs/Aug31_13-43-24_surveily-ag-02/events.out.tfevents.1693482893.surveily-ag-02.6684.3 +3 -0
runs/Aug31_13-55-36_surveily-ag-02/events.out.tfevents.1693482936.surveily-ag-02.6684.4 +3 -0
runs/Aug31_13-55-36_surveily-ag-02/events.out.tfevents.1693483672.surveily-ag-02.6684.5 +3 -0
test_results.json +5 -5
train_results.json +4 -4
trainer_state.json +179 -131
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
     "epoch": 5.0,
-    "eval_accuracy": 0.9382716049382716,
-    "eval_loss": 0.16537487506866455,
-    "eval_runtime": 7.4881,
-    "eval_samples_per_second": 75.72,
-    "eval_steps_per_second": 9.482,
-    "test_accuracy": 0.7333333333333333,
-    "test_loss": 0.6995685696601868,
-    "test_runtime": 0.645,
-    "test_samples_per_second": 46.51,
-    "test_steps_per_second": 6.201,
-    "train_loss": 0.11905734094947872,
-    "train_runtime": 363.8199,
-    "train_samples_per_second": 55.412,
-    "train_steps_per_second": 5.552
 }

 {
     "epoch": 5.0,
+    "eval_accuracy": 0.9915611814345991,
+    "eval_loss": 0.023517148569226265,
+    "eval_runtime": 14.6863,
+    "eval_samples_per_second": 80.687,
+    "eval_steps_per_second": 10.145,
+    "test_accuracy": 0.9333333333333333,
+    "test_loss": 0.32354873418807983,
+    "test_runtime": 0.5696,
+    "test_samples_per_second": 52.669,
+    "test_steps_per_second": 7.022,
+    "train_loss": 0.004172653943921321,
+    "train_runtime": 720.5262,
+    "train_samples_per_second": 35.079,
+    "train_steps_per_second": 3.511
 }

config.json CHANGED Viewed

@@ -1,50 +1,34 @@
 {
-  "_name_or_path": "microsoft/resnet-50",
   "architectures": [
-    "ResNetForImageClassification"
-  ],
-  "depths": [
-    3,
-    4,
-    6,
-    3
-  ],
-  "downsample_in_first_stage": false,
-  "embedding_size": 64,
-  "hidden_act": "relu",
-  "hidden_sizes": [
-    256,
-    512,
-    1024,
-    2048
   ],
   "id2label": {
     "0": "cctv",
     "1": "phone",
     "2": "topdown"
   },
   "label2id": {
     "cctv": "0",
     "phone": "1",
     "topdown": "2"
   },
-  "layer_type": "bottleneck",
-  "model_type": "resnet",
   "num_channels": 3,
-  "out_features": [
-    "stage4"
-  ],
-  "out_indices": [
-    4
-  ],
   "problem_type": "single_label_classification",
-  "stage_names": [
-    "stem",
-    "stage1",
-    "stage2",
-    "stage3",
-    "stage4"
-  ],
   "torch_dtype": "float32",
   "transformers_version": "4.31.0"
 }

 {
+  "_name_or_path": "google/vit-base-patch16-224",
   "architectures": [
+    "ViTForImageClassification"
   ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
   "id2label": {
     "0": "cctv",
     "1": "phone",
     "2": "topdown"
   },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
   "label2id": {
     "cctv": "0",
     "phone": "1",
     "topdown": "2"
   },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
   "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
   "problem_type": "single_label_classification",
+  "qkv_bias": true,
   "torch_dtype": "float32",
   "transformers_version": "4.31.0"
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 5.0,
-    "eval_accuracy": 0.9382716049382716,
-    "eval_loss": 0.16537487506866455,
-    "eval_runtime": 7.4881,
-    "eval_samples_per_second": 75.72,
-    "eval_steps_per_second": 9.482
 }

 {
     "epoch": 5.0,
+    "eval_accuracy": 0.9915611814345991,
+    "eval_loss": 0.023517148569226265,
+    "eval_runtime": 14.6863,
+    "eval_samples_per_second": 80.687,
+    "eval_steps_per_second": 10.145
 }

preprocessor_config.json CHANGED Viewed

@@ -1,23 +1,22 @@
 {
-  "crop_pct": 0.875,
   "do_normalize": true,
   "do_rescale": true,
   "do_resize": true,
-  "feature_extractor_type": "ConvNextFeatureExtractor",
   "image_mean": [
-    0.485,
-    0.456,
-    0.406
   ],
-  "image_processor_type": "ConvNextFeatureExtractor",
   "image_std": [
-    0.229,
-    0.224,
-    0.225
   ],
-  "resample": 3,
   "rescale_factor": 0.00392156862745098,
   "size": {
-    "shortest_edge": 224
   }
 }

 {
   "do_normalize": true,
   "do_rescale": true,
   "do_resize": true,
   "image_mean": [
+    0.5,
+    0.5,
+    0.5
   ],
+  "image_processor_type": "ViTFeatureExtractor",
   "image_std": [
+    0.5,
+    0.5,
+    0.5
   ],
+  "resample": 2,
   "rescale_factor": 0.00392156862745098,
   "size": {
+    "height": 224,
+    "width": 224
   }
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:195f177d2ea1e6d0901fc59cc04a229e62d799533ac9c374eb6c7e6629c50c2d
-size 94383181

 version https://git-lfs.github.com/spec/v1
+oid sha256:1d9e93a397eb093ec4fe14e8f7d6fb52de2afc10b7ad8b9ef877e9aa5d2a458a
+size 343271789

runs/Aug31_13-25-03_surveily-ag-02/events.out.tfevents.1693481104.surveily-ag-02.6684.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6a8150829bfd690e36c5e4280aed25f63f65c18dcec6b040ef5939f7fc6853df
+size 11453

runs/Aug31_13-25-03_surveily-ag-02/events.out.tfevents.1693481674.surveily-ag-02.6684.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fd2ee4cd89b083af9df09cc39f4788f721476b567541854e5b4eb9d6d9479790
+size 411

runs/Aug31_13-43-24_surveily-ag-02/events.out.tfevents.1693482204.surveily-ag-02.6684.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6db5aba99827c972325207483473787c02fcf1433e9e9bce2ac2dbae8cd68d0a
+size 11610

runs/Aug31_13-43-24_surveily-ag-02/events.out.tfevents.1693482893.surveily-ag-02.6684.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:60a1b0454aa07e5a92c413ebc60514fa0bed3631b9017380fc60326928122fe4
+size 411

runs/Aug31_13-55-36_surveily-ag-02/events.out.tfevents.1693482936.surveily-ag-02.6684.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b1f532bb293059f29bf35a92c097c9eb47302ea9222cd71ab60cfef1b10a8815
+size 12247

runs/Aug31_13-55-36_surveily-ag-02/events.out.tfevents.1693483672.surveily-ag-02.6684.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b5c396d8de2a5d761ce4147709ecbdcf736b21baf22c82cc36df526257a33ae
+size 411

test_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "test_accuracy": 0.7333333333333333,
-    "test_loss": 0.6995685696601868,
-    "test_runtime": 0.645,
-    "test_samples_per_second": 46.51,
-    "test_steps_per_second": 6.201
 }

 {
+    "test_accuracy": 0.9333333333333333,
+    "test_loss": 0.32354873418807983,
+    "test_runtime": 0.5696,
+    "test_samples_per_second": 52.669,
+    "test_steps_per_second": 7.022
 }

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 5.0,
-    "train_loss": 0.11905734094947872,
-    "train_runtime": 363.8199,
-    "train_samples_per_second": 55.412,
-    "train_steps_per_second": 5.552
 }

 {
     "epoch": 5.0,
+    "train_loss": 0.004172653943921321,
+    "train_runtime": 720.5262,
+    "train_samples_per_second": 35.079,
+    "train_steps_per_second": 3.511
 }

trainer_state.json CHANGED Viewed

@@ -1,235 +1,283 @@
 {
-  "best_metric": 0.16537487506866455,
-  "best_model_checkpoint": "./models/camera-type/checkpoint-400",
   "epoch": 5.0,
-  "global_step": 2020,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.25,
-      "learning_rate": 9.504950495049505e-05,
-      "loss": 0.895,
       "step": 100
     },
     {
-      "epoch": 0.5,
-      "learning_rate": 9.014851485148515e-05,
-      "loss": 0.4597,
       "step": 200
     },
     {
-      "epoch": 0.5,
-      "eval_accuracy": 0.9241622574955908,
-      "eval_loss": 0.2800751328468323,
-      "eval_runtime": 7.8295,
-      "eval_samples_per_second": 72.419,
-      "eval_steps_per_second": 9.068,
       "step": 200
     },
     {
-      "epoch": 0.74,
-      "learning_rate": 8.51980198019802e-05,
-      "loss": 0.2158,
       "step": 300
     },
     {
-      "epoch": 0.99,
-      "learning_rate": 8.02970297029703e-05,
-      "loss": 0.1375,
       "step": 400
     },
     {
-      "epoch": 0.99,
-      "eval_accuracy": 0.9382716049382716,
-      "eval_loss": 0.16537487506866455,
-      "eval_runtime": 8.6108,
-      "eval_samples_per_second": 65.848,
-      "eval_steps_per_second": 8.245,
       "step": 400
     },
     {
-      "epoch": 1.24,
-      "learning_rate": 7.534653465346535e-05,
-      "loss": 0.097,
       "step": 500
     },
     {
-      "epoch": 1.49,
-      "learning_rate": 7.039603960396039e-05,
-      "loss": 0.0795,
       "step": 600
     },
     {
-      "epoch": 1.49,
-      "eval_accuracy": 0.9382716049382716,
-      "eval_loss": 0.1904107928276062,
-      "eval_runtime": 7.6784,
-      "eval_samples_per_second": 73.843,
-      "eval_steps_per_second": 9.247,
       "step": 600
     },
     {
-      "epoch": 1.73,
-      "learning_rate": 6.544554455445545e-05,
-      "loss": 0.0756,
       "step": 700
     },
     {
-      "epoch": 1.98,
-      "learning_rate": 6.0495049504950496e-05,
-      "loss": 0.0686,
       "step": 800
     },
     {
-      "epoch": 1.98,
-      "eval_accuracy": 0.9453262786596119,
-      "eval_loss": 0.18103937804698944,
-      "eval_runtime": 8.0556,
-      "eval_samples_per_second": 70.386,
-      "eval_steps_per_second": 8.814,
       "step": 800
     },
     {
-      "epoch": 2.23,
-      "learning_rate": 5.5544554455445554e-05,
-      "loss": 0.0369,
       "step": 900
     },
     {
-      "epoch": 2.48,
-      "learning_rate": 5.05940594059406e-05,
-      "loss": 0.026,
       "step": 1000
     },
     {
-      "epoch": 2.48,
-      "eval_accuracy": 0.9400352733686067,
-      "eval_loss": 0.22161062061786652,
-      "eval_runtime": 7.6989,
-      "eval_samples_per_second": 73.647,
-      "eval_steps_per_second": 9.222,
       "step": 1000
     },
     {
-      "epoch": 2.72,
-      "learning_rate": 4.5643564356435645e-05,
-      "loss": 0.0266,
       "step": 1100
     },
     {
-      "epoch": 2.97,
-      "learning_rate": 4.069306930693069e-05,
-      "loss": 0.0495,
       "step": 1200
     },
     {
-      "epoch": 2.97,
-      "eval_accuracy": 0.9453262786596119,
-      "eval_loss": 0.20959477126598358,
-      "eval_runtime": 7.4625,
-      "eval_samples_per_second": 75.98,
-      "eval_steps_per_second": 9.514,
       "step": 1200
     },
     {
-      "epoch": 3.22,
-      "learning_rate": 3.579207920792079e-05,
-      "loss": 0.0354,
       "step": 1300
     },
     {
-      "epoch": 3.47,
-      "learning_rate": 3.0841584158415845e-05,
-      "loss": 0.0487,
       "step": 1400
     },
     {
-      "epoch": 3.47,
-      "eval_accuracy": 0.9435626102292769,
-      "eval_loss": 0.21740128099918365,
-      "eval_runtime": 7.5927,
-      "eval_samples_per_second": 74.677,
-      "eval_steps_per_second": 9.351,
       "step": 1400
     },
     {
-      "epoch": 3.71,
-      "learning_rate": 2.5891089108910893e-05,
-      "loss": 0.0186,
       "step": 1500
     },
     {
-      "epoch": 3.96,
-      "learning_rate": 2.0940594059405942e-05,
-      "loss": 0.0268,
       "step": 1600
     },
     {
-      "epoch": 3.96,
-      "eval_accuracy": 0.9453262786596119,
-      "eval_loss": 0.23042456805706024,
-      "eval_runtime": 7.4693,
-      "eval_samples_per_second": 75.911,
-      "eval_steps_per_second": 9.506,
       "step": 1600
     },
     {
-      "epoch": 4.21,
-      "learning_rate": 1.599009900990099e-05,
-      "loss": 0.031,
       "step": 1700
     },
     {
-      "epoch": 4.46,
-      "learning_rate": 1.103960396039604e-05,
-      "loss": 0.0254,
       "step": 1800
     },
     {
-      "epoch": 4.46,
-      "eval_accuracy": 0.9400352733686067,
-      "eval_loss": 0.25736740231513977,
-      "eval_runtime": 7.6456,
-      "eval_samples_per_second": 74.16,
-      "eval_steps_per_second": 9.286,
       "step": 1800
     },
     {
-      "epoch": 4.7,
-      "learning_rate": 6.089108910891089e-06,
-      "loss": 0.0303,
       "step": 1900
     },
     {
-      "epoch": 4.95,
-      "learning_rate": 1.1386138613861386e-06,
-      "loss": 0.0186,
       "step": 2000
     },
     {
-      "epoch": 4.95,
-      "eval_accuracy": 0.9382716049382716,
-      "eval_loss": 0.3211604356765747,
-      "eval_runtime": 7.4741,
-      "eval_samples_per_second": 75.862,
-      "eval_steps_per_second": 9.499,
       "step": 2000
     },
     {
       "epoch": 5.0,
-      "step": 2020,
-      "total_flos": 4.281430410244915e+17,
-      "train_loss": 0.11905734094947872,
-      "train_runtime": 363.8199,
-      "train_samples_per_second": 55.412,
-      "train_steps_per_second": 5.552
     }
   ],
-  "max_steps": 2020,
   "num_train_epochs": 5,
-  "total_flos": 4.281430410244915e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.023517148569226265,
+  "best_model_checkpoint": "./models/camera-type/checkpoint-200",
   "epoch": 5.0,
+  "global_step": 2530,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.2,
+      "learning_rate": 9.604743083003953e-05,
+      "loss": 0.0703,
       "step": 100
     },
     {
+      "epoch": 0.4,
+      "learning_rate": 9.213438735177866e-05,
+      "loss": 0.0064,
       "step": 200
     },
     {
+      "epoch": 0.4,
+      "eval_accuracy": 0.9915611814345991,
+      "eval_loss": 0.023517148569226265,
+      "eval_runtime": 13.6256,
+      "eval_samples_per_second": 86.968,
+      "eval_steps_per_second": 10.935,
       "step": 200
     },
     {
+      "epoch": 0.59,
+      "learning_rate": 8.818181818181818e-05,
+      "loss": 0.015,
       "step": 300
     },
     {
+      "epoch": 0.79,
+      "learning_rate": 8.426877470355731e-05,
+      "loss": 0.0034,
       "step": 400
     },
     {
+      "epoch": 0.79,
+      "eval_accuracy": 0.9940928270042194,
+      "eval_loss": 0.03918765112757683,
+      "eval_runtime": 26.2367,
+      "eval_samples_per_second": 45.166,
+      "eval_steps_per_second": 5.679,
       "step": 400
     },
     {
+      "epoch": 0.99,
+      "learning_rate": 8.031620553359685e-05,
+      "loss": 0.0036,
       "step": 500
     },
     {
+      "epoch": 1.19,
+      "learning_rate": 7.636363636363637e-05,
+      "loss": 0.0066,
       "step": 600
     },
     {
+      "epoch": 1.19,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.10105644911527634,
+      "eval_runtime": 13.5269,
+      "eval_samples_per_second": 87.603,
+      "eval_steps_per_second": 11.015,
       "step": 600
     },
     {
+      "epoch": 1.38,
+      "learning_rate": 7.24110671936759e-05,
+      "loss": 0.0001,
       "step": 700
     },
     {
+      "epoch": 1.58,
+      "learning_rate": 6.845849802371542e-05,
+      "loss": 0.0,
       "step": 800
     },
     {
+      "epoch": 1.58,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.12266893684864044,
+      "eval_runtime": 14.2674,
+      "eval_samples_per_second": 83.057,
+      "eval_steps_per_second": 10.443,
       "step": 800
     },
     {
+      "epoch": 1.78,
+      "learning_rate": 6.450592885375494e-05,
+      "loss": 0.0,
       "step": 900
     },
     {
+      "epoch": 1.98,
+      "learning_rate": 6.055335968379446e-05,
+      "loss": 0.0,
       "step": 1000
     },
     {
+      "epoch": 1.98,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.12320054322481155,
+      "eval_runtime": 13.4323,
+      "eval_samples_per_second": 88.22,
+      "eval_steps_per_second": 11.093,
       "step": 1000
     },
     {
+      "epoch": 2.17,
+      "learning_rate": 5.660079051383399e-05,
+      "loss": 0.0,
       "step": 1100
     },
     {
+      "epoch": 2.37,
+      "learning_rate": 5.2648221343873516e-05,
+      "loss": 0.0,
       "step": 1200
     },
     {
+      "epoch": 2.37,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.143290176987648,
+      "eval_runtime": 14.5978,
+      "eval_samples_per_second": 81.177,
+      "eval_steps_per_second": 10.207,
       "step": 1200
     },
     {
+      "epoch": 2.57,
+      "learning_rate": 4.8695652173913046e-05,
+      "loss": 0.0,
       "step": 1300
     },
     {
+      "epoch": 2.77,
+      "learning_rate": 4.4743083003952576e-05,
+      "loss": 0.0,
       "step": 1400
     },
     {
+      "epoch": 2.77,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.14161579310894012,
+      "eval_runtime": 13.9736,
+      "eval_samples_per_second": 84.803,
+      "eval_steps_per_second": 10.663,
       "step": 1400
     },
     {
+      "epoch": 2.96,
+      "learning_rate": 4.079051383399209e-05,
+      "loss": 0.0,
       "step": 1500
     },
     {
+      "epoch": 3.16,
+      "learning_rate": 3.6837944664031623e-05,
+      "loss": 0.0,
       "step": 1600
     },
     {
+      "epoch": 3.16,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.14079466462135315,
+      "eval_runtime": 13.3148,
+      "eval_samples_per_second": 88.999,
+      "eval_steps_per_second": 11.191,
       "step": 1600
     },
     {
+      "epoch": 3.36,
+      "learning_rate": 3.288537549407115e-05,
+      "loss": 0.0,
       "step": 1700
     },
     {
+      "epoch": 3.56,
+      "learning_rate": 2.8932806324110674e-05,
+      "loss": 0.0,
       "step": 1800
     },
     {
+      "epoch": 3.56,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.140061616897583,
+      "eval_runtime": 13.4092,
+      "eval_samples_per_second": 88.372,
+      "eval_steps_per_second": 11.112,
       "step": 1800
     },
     {
+      "epoch": 3.75,
+      "learning_rate": 2.4980237154150198e-05,
+      "loss": 0.0,
       "step": 1900
     },
     {
+      "epoch": 3.95,
+      "learning_rate": 2.1027667984189725e-05,
+      "loss": 0.0,
       "step": 2000
     },
     {
+      "epoch": 3.95,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.13938628137111664,
+      "eval_runtime": 13.5631,
+      "eval_samples_per_second": 87.369,
+      "eval_steps_per_second": 10.986,
       "step": 2000
     },
+    {
+      "epoch": 4.15,
+      "learning_rate": 1.707509881422925e-05,
+      "loss": 0.0,
+      "step": 2100
+    },
+    {
+      "epoch": 4.35,
+      "learning_rate": 1.3122529644268775e-05,
+      "loss": 0.0,
+      "step": 2200
+    },
+    {
+      "epoch": 4.35,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.13903304934501648,
+      "eval_runtime": 14.2016,
+      "eval_samples_per_second": 83.441,
+      "eval_steps_per_second": 10.492,
+      "step": 2200
+    },
+    {
+      "epoch": 4.55,
+      "learning_rate": 9.1699604743083e-06,
+      "loss": 0.0,
+      "step": 2300
+    },
+    {
+      "epoch": 4.74,
+      "learning_rate": 5.217391304347826e-06,
+      "loss": 0.0,
+      "step": 2400
+    },
+    {
+      "epoch": 4.74,
+      "eval_accuracy": 0.9839662447257383,
+      "eval_loss": 0.13887113332748413,
+      "eval_runtime": 13.5995,
+      "eval_samples_per_second": 87.136,
+      "eval_steps_per_second": 10.956,
+      "step": 2400
+    },
+    {
+      "epoch": 4.94,
+      "learning_rate": 1.2648221343873517e-06,
+      "loss": 0.0,
+      "step": 2500
+    },
     {
       "epoch": 5.0,
+      "step": 2530,
+      "total_flos": 1.9586275919110656e+18,
+      "train_loss": 0.004172653943921321,
+      "train_runtime": 720.5262,
+      "train_samples_per_second": 35.079,
+      "train_steps_per_second": 3.511
     }
   ],
+  "max_steps": 2530,
   "num_train_epochs": 5,
+  "total_flos": 1.9586275919110656e+18,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eaeda358597efe759e938c6fa8910566dc86c2f58aef60d15672b1d0c4b75915
 size 4027

 version https://git-lfs.github.com/spec/v1
+oid sha256:5a891659bbef29a096768cfc757449f649d7adc620258759a34f11798e1676ca
 size 4027