End of training

Browse files

Files changed (12) hide show

README.md +42 -42
all_results.json +9 -9
eval_results.json +5 -5
model.safetensors +1 -1
runs/Oct11_17-14-38_DESKTOP-SKBE9FB/events.out.tfevents.1728688479.DESKTOP-SKBE9FB.10424.0 +3 -0
runs/Oct11_17-14-38_DESKTOP-SKBE9FB/events.out.tfevents.1728689179.DESKTOP-SKBE9FB.10424.1 +3 -0
runs/Oct11_17-28-45_DESKTOP-SKBE9FB/events.out.tfevents.1728689327.DESKTOP-SKBE9FB.15824.0 +3 -0
runs/Oct11_17-30-54_DESKTOP-SKBE9FB/events.out.tfevents.1728689455.DESKTOP-SKBE9FB.9024.0 +3 -0
runs/Oct11_17-30-54_DESKTOP-SKBE9FB/events.out.tfevents.1728690167.DESKTOP-SKBE9FB.9024.1 +3 -0
train_results.json +4 -4
trainer_state.json +229 -229
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -17,12 +17,12 @@ model-index:
       name: imagefolder
       type: imagefolder
       config: default
-      split: validation
       args: default
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.8387096774193549
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5389
-- Accuracy: 0.8387
 ## Model description
@@ -52,7 +52,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 3.8e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
@@ -67,43 +67,43 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| No log        | 0.91  | 5    | 1.7603          | 0.1452   |
-| 1.7693        | 2.0   | 11   | 1.6916          | 0.1452   |
-| 1.7693        | 2.91  | 16   | 1.5752          | 0.1452   |
-| 1.6261        | 4.0   | 22   | 1.4015          | 0.1452   |
-| 1.6261        | 4.91  | 27   | 1.2890          | 0.1452   |
-| 1.3534        | 6.0   | 33   | 1.2128          | 0.3710   |
-| 1.3534        | 6.91  | 38   | 1.1418          | 0.4032   |
-| 1.1661        | 8.0   | 44   | 1.0727          | 0.4677   |
-| 1.1661        | 8.91  | 49   | 1.0909          | 0.4032   |
-| 1.0344        | 10.0  | 55   | 0.9719          | 0.6129   |
-| 0.9604        | 10.91 | 60   | 0.9923          | 0.6452   |
-| 0.9604        | 12.0  | 66   | 0.9554          | 0.6290   |
-| 0.8477        | 12.91 | 71   | 0.9156          | 0.6774   |
-| 0.8477        | 14.0  | 77   | 0.8339          | 0.7097   |
-| 0.7727        | 14.91 | 82   | 0.7851          | 0.7258   |
-| 0.7727        | 16.0  | 88   | 0.7994          | 0.7258   |
-| 0.6714        | 16.91 | 93   | 0.8246          | 0.6290   |
-| 0.6714        | 18.0  | 99   | 0.7389          | 0.7097   |
-| 0.6143        | 18.91 | 104  | 0.8202          | 0.6452   |
-| 0.5398        | 20.0  | 110  | 0.6295          | 0.7742   |
-| 0.5398        | 20.91 | 115  | 0.6736          | 0.7581   |
-| 0.4958        | 22.0  | 121  | 0.6218          | 0.7903   |
-| 0.4958        | 22.91 | 126  | 0.6401          | 0.7742   |
-| 0.4561        | 24.0  | 132  | 0.6640          | 0.7258   |
-| 0.4561        | 24.91 | 137  | 0.6009          | 0.7742   |
-| 0.4149        | 26.0  | 143  | 0.5619          | 0.8065   |
-| 0.4149        | 26.91 | 148  | 0.5118          | 0.8065   |
-| 0.3965        | 28.0  | 154  | 0.5682          | 0.8065   |
-| 0.3965        | 28.91 | 159  | 0.5515          | 0.8065   |
-| 0.4219        | 30.0  | 165  | 0.7045          | 0.7097   |
-| 0.3939        | 30.91 | 170  | 0.5712          | 0.8065   |
-| 0.3939        | 32.0  | 176  | 0.5857          | 0.8065   |
-| 0.3598        | 32.91 | 181  | 0.5539          | 0.8065   |
-| 0.3598        | 34.0  | 187  | 0.5471          | 0.8226   |
-| 0.3613        | 34.91 | 192  | 0.5408          | 0.8226   |
-| 0.3613        | 36.0  | 198  | 0.5389          | 0.8387   |
-| 0.3748        | 36.36 | 200  | 0.5390          | 0.8387   |
 ### Framework versions

       name: imagefolder
       type: imagefolder
       config: default
+      split: train
       args: default
     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.9032258064516129
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4274
+- Accuracy: 0.9032
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 0.91  | 5    | 1.7093          | 0.1774   |
+| 1.7744        | 2.0   | 11   | 1.6178          | 0.1774   |
+| 1.7744        | 2.91  | 16   | 1.4730          | 0.1774   |
+| 1.5823        | 4.0   | 22   | 1.2754          | 0.1774   |
+| 1.5823        | 4.91  | 27   | 1.1455          | 0.5645   |
+| 1.27          | 6.0   | 33   | 1.0147          | 0.6290   |
+| 1.27          | 6.91  | 38   | 0.9790          | 0.5484   |
+| 1.079         | 8.0   | 44   | 1.0474          | 0.4516   |
+| 1.079         | 8.91  | 49   | 0.8796          | 0.7581   |
+| 1.005         | 10.0  | 55   | 0.7759          | 0.7742   |
+| 0.8479        | 10.91 | 60   | 0.7421          | 0.8226   |
+| 0.8479        | 12.0  | 66   | 0.6760          | 0.8548   |
+| 0.7695        | 12.91 | 71   | 0.5933          | 0.8387   |
+| 0.7695        | 14.0  | 77   | 0.6372          | 0.7742   |
+| 0.6591        | 14.91 | 82   | 0.5653          | 0.8387   |
+| 0.6591        | 16.0  | 88   | 0.4950          | 0.8710   |
+| 0.5675        | 16.91 | 93   | 0.5040          | 0.8226   |
+| 0.5675        | 18.0  | 99   | 0.4274          | 0.9032   |
+| 0.5134        | 18.91 | 104  | 0.4617          | 0.8548   |
+| 0.4418        | 20.0  | 110  | 0.4245          | 0.8871   |
+| 0.4418        | 20.91 | 115  | 0.4922          | 0.8387   |
+| 0.402         | 22.0  | 121  | 0.5112          | 0.8226   |
+| 0.402         | 22.91 | 126  | 0.4696          | 0.8548   |
+| 0.4039        | 24.0  | 132  | 0.4014          | 0.8710   |
+| 0.4039        | 24.91 | 137  | 0.5006          | 0.8226   |
+| 0.4216        | 26.0  | 143  | 0.5351          | 0.8548   |
+| 0.4216        | 26.91 | 148  | 0.5203          | 0.8548   |
+| 0.3593        | 28.0  | 154  | 0.4082          | 0.8548   |
+| 0.3593        | 28.91 | 159  | 0.4017          | 0.8710   |
+| 0.3638        | 30.0  | 165  | 0.4068          | 0.8871   |
+| 0.3509        | 30.91 | 170  | 0.3991          | 0.8871   |
+| 0.3509        | 32.0  | 176  | 0.3965          | 0.8710   |
+| 0.3426        | 32.91 | 181  | 0.3921          | 0.8710   |
+| 0.3426        | 34.0  | 187  | 0.3998          | 0.8710   |
+| 0.3253        | 34.91 | 192  | 0.4102          | 0.8871   |
+| 0.3253        | 36.0  | 198  | 0.4081          | 0.8871   |
+| 0.3085        | 36.36 | 200  | 0.4083          | 0.8871   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 36.36,
-    "eval_accuracy": 0.8387096774193549,
-    "eval_loss": 0.5388934016227722,
-    "eval_runtime": 2.3395,
-    "eval_samples_per_second": 26.501,
-    "eval_steps_per_second": 1.71,
-    "train_loss": 0.7515219366550445,
-    "train_runtime": 697.4947,
-    "train_samples_per_second": 20.072,
-    "train_steps_per_second": 0.287
 }

 {
     "epoch": 36.36,
+    "eval_accuracy": 0.9032258064516129,
+    "eval_loss": 0.4273931682109833,
+    "eval_runtime": 2.4718,
+    "eval_samples_per_second": 25.083,
+    "eval_steps_per_second": 1.618,
+    "train_loss": 0.6893912732601166,
+    "train_runtime": 709.0628,
+    "train_samples_per_second": 19.744,
+    "train_steps_per_second": 0.282
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 36.36,
-    "eval_accuracy": 0.8387096774193549,
-    "eval_loss": 0.5388934016227722,
-    "eval_runtime": 2.3395,
-    "eval_samples_per_second": 26.501,
-    "eval_steps_per_second": 1.71
 }

 {
     "epoch": 36.36,
+    "eval_accuracy": 0.9032258064516129,
+    "eval_loss": 0.4273931682109833,
+    "eval_runtime": 2.4718,
+    "eval_samples_per_second": 25.083,
+    "eval_steps_per_second": 1.618
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:59924b060910eddb739a9254c885be73dcdec77373c5fa406b5d448ab0ce9573
 size 343086480

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d96908ad48e4d7c197f6f3197c8f8e7fa17c3e3387440d03677a0382a863f75
 size 343086480

runs/Oct11_17-14-38_DESKTOP-SKBE9FB/events.out.tfevents.1728688479.DESKTOP-SKBE9FB.10424.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f5f1edd262d1cad2045fec2fc53ab4f9e4a38b18f4e3b5ef65738e1076a6887e
+size 20604

runs/Oct11_17-14-38_DESKTOP-SKBE9FB/events.out.tfevents.1728689179.DESKTOP-SKBE9FB.10424.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:69e9e033122585d2c4755c85276ecb8c1151e21ffb8335db8ab14af9ff167f43
+size 411

runs/Oct11_17-28-45_DESKTOP-SKBE9FB/events.out.tfevents.1728689327.DESKTOP-SKBE9FB.15824.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7572a843c89ad80a11666ae3032c7bbfdc0b847c9da2496fcae4ab06890dcb7d
+size 6909

runs/Oct11_17-30-54_DESKTOP-SKBE9FB/events.out.tfevents.1728689455.DESKTOP-SKBE9FB.9024.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2bb5741a9bcd3606a3c061a02230595b52f382c9383a79bb712bce3eb54451d5
+size 20604

runs/Oct11_17-30-54_DESKTOP-SKBE9FB/events.out.tfevents.1728690167.DESKTOP-SKBE9FB.9024.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dc0f93adcf4af56501d2cb9befeb4c41b5bc602e95448ab9fcab16efd6528b83
+size 411

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 36.36,
-    "train_loss": 0.7515219366550445,
-    "train_runtime": 697.4947,
-    "train_samples_per_second": 20.072,
-    "train_steps_per_second": 0.287
 }

 {
     "epoch": 36.36,
+    "train_loss": 0.6893912732601166,
+    "train_runtime": 709.0628,
+    "train_samples_per_second": 19.744,
+    "train_steps_per_second": 0.282
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.8387096774193549,
-  "best_model_checkpoint": "beit-base-patch16-224-OT-alt\\checkpoint-198",
   "epoch": 36.36363636363637,
   "eval_steps": 500,
   "global_step": 200,
@@ -10,465 +10,465 @@
   "log_history": [
     {
       "epoch": 0.91,
-      "eval_accuracy": 0.14516129032258066,
-      "eval_loss": 1.7602910995483398,
-      "eval_runtime": 2.2295,
-      "eval_samples_per_second": 27.809,
-      "eval_steps_per_second": 1.794,
       "step": 5
     },
     {
       "epoch": 1.82,
-      "learning_rate": 1.9e-05,
-      "loss": 1.7693,
       "step": 10
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.14516129032258066,
-      "eval_loss": 1.6916192770004272,
-      "eval_runtime": 2.248,
-      "eval_samples_per_second": 27.579,
-      "eval_steps_per_second": 1.779,
       "step": 11
     },
     {
       "epoch": 2.91,
-      "eval_accuracy": 0.14516129032258066,
-      "eval_loss": 1.5752112865447998,
-      "eval_runtime": 2.2645,
-      "eval_samples_per_second": 27.379,
-      "eval_steps_per_second": 1.766,
       "step": 16
     },
     {
       "epoch": 3.64,
-      "learning_rate": 3.8e-05,
-      "loss": 1.6261,
       "step": 20
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.14516129032258066,
-      "eval_loss": 1.4015283584594727,
-      "eval_runtime": 2.295,
-      "eval_samples_per_second": 27.015,
-      "eval_steps_per_second": 1.743,
       "step": 22
     },
     {
       "epoch": 4.91,
-      "eval_accuracy": 0.14516129032258066,
-      "eval_loss": 1.2889776229858398,
-      "eval_runtime": 2.279,
-      "eval_samples_per_second": 27.205,
-      "eval_steps_per_second": 1.755,
       "step": 27
     },
     {
       "epoch": 5.45,
-      "learning_rate": 3.588888888888889e-05,
-      "loss": 1.3534,
       "step": 30
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.3709677419354839,
-      "eval_loss": 1.2128400802612305,
-      "eval_runtime": 2.3157,
-      "eval_samples_per_second": 26.774,
-      "eval_steps_per_second": 1.727,
       "step": 33
     },
     {
       "epoch": 6.91,
-      "eval_accuracy": 0.4032258064516129,
-      "eval_loss": 1.1418391466140747,
-      "eval_runtime": 2.2485,
-      "eval_samples_per_second": 27.573,
-      "eval_steps_per_second": 1.779,
       "step": 38
     },
     {
       "epoch": 7.27,
-      "learning_rate": 3.3777777777777776e-05,
-      "loss": 1.1661,
       "step": 40
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.46774193548387094,
-      "eval_loss": 1.0726869106292725,
-      "eval_runtime": 2.247,
-      "eval_samples_per_second": 27.592,
-      "eval_steps_per_second": 1.78,
       "step": 44
     },
     {
       "epoch": 8.91,
-      "eval_accuracy": 0.4032258064516129,
-      "eval_loss": 1.0908629894256592,
-      "eval_runtime": 2.288,
-      "eval_samples_per_second": 27.097,
-      "eval_steps_per_second": 1.748,
       "step": 49
     },
     {
       "epoch": 9.09,
-      "learning_rate": 3.166666666666667e-05,
-      "loss": 1.0344,
       "step": 50
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 0.6129032258064516,
-      "eval_loss": 0.9719263911247253,
-      "eval_runtime": 2.2685,
-      "eval_samples_per_second": 27.33,
-      "eval_steps_per_second": 1.763,
       "step": 55
     },
     {
       "epoch": 10.91,
-      "learning_rate": 2.9555555555555556e-05,
-      "loss": 0.9604,
       "step": 60
     },
     {
       "epoch": 10.91,
-      "eval_accuracy": 0.6451612903225806,
-      "eval_loss": 0.9922870397567749,
-      "eval_runtime": 2.249,
-      "eval_samples_per_second": 27.567,
-      "eval_steps_per_second": 1.779,
       "step": 60
     },
     {
       "epoch": 12.0,
-      "eval_accuracy": 0.6290322580645161,
-      "eval_loss": 0.9554464221000671,
-      "eval_runtime": 2.3255,
-      "eval_samples_per_second": 26.661,
-      "eval_steps_per_second": 1.72,
       "step": 66
     },
     {
       "epoch": 12.73,
-      "learning_rate": 2.7444444444444447e-05,
-      "loss": 0.8477,
       "step": 70
     },
     {
       "epoch": 12.91,
-      "eval_accuracy": 0.6774193548387096,
-      "eval_loss": 0.9155737161636353,
-      "eval_runtime": 2.259,
-      "eval_samples_per_second": 27.445,
-      "eval_steps_per_second": 1.771,
       "step": 71
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.7096774193548387,
-      "eval_loss": 0.833889901638031,
-      "eval_runtime": 2.3145,
-      "eval_samples_per_second": 26.788,
-      "eval_steps_per_second": 1.728,
       "step": 77
     },
     {
       "epoch": 14.55,
-      "learning_rate": 2.5333333333333334e-05,
-      "loss": 0.7727,
       "step": 80
     },
     {
       "epoch": 14.91,
-      "eval_accuracy": 0.7258064516129032,
-      "eval_loss": 0.7850545048713684,
-      "eval_runtime": 2.2951,
-      "eval_samples_per_second": 27.015,
-      "eval_steps_per_second": 1.743,
       "step": 82
     },
     {
       "epoch": 16.0,
-      "eval_accuracy": 0.7258064516129032,
-      "eval_loss": 0.7993963956832886,
-      "eval_runtime": 2.2405,
-      "eval_samples_per_second": 27.672,
-      "eval_steps_per_second": 1.785,
       "step": 88
     },
     {
       "epoch": 16.36,
-      "learning_rate": 2.3222222222222224e-05,
-      "loss": 0.6714,
       "step": 90
     },
     {
       "epoch": 16.91,
-      "eval_accuracy": 0.6290322580645161,
-      "eval_loss": 0.8245651721954346,
-      "eval_runtime": 2.1735,
-      "eval_samples_per_second": 28.525,
-      "eval_steps_per_second": 1.84,
       "step": 93
     },
     {
       "epoch": 18.0,
-      "eval_accuracy": 0.7096774193548387,
-      "eval_loss": 0.738938570022583,
-      "eval_runtime": 2.2195,
-      "eval_samples_per_second": 27.934,
-      "eval_steps_per_second": 1.802,
       "step": 99
     },
     {
       "epoch": 18.18,
-      "learning_rate": 2.1111111111111114e-05,
-      "loss": 0.6143,
       "step": 100
     },
     {
       "epoch": 18.91,
-      "eval_accuracy": 0.6451612903225806,
-      "eval_loss": 0.8202147483825684,
-      "eval_runtime": 2.2165,
-      "eval_samples_per_second": 27.972,
-      "eval_steps_per_second": 1.805,
       "step": 104
     },
     {
       "epoch": 20.0,
-      "learning_rate": 1.9e-05,
-      "loss": 0.5398,
       "step": 110
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 0.7741935483870968,
-      "eval_loss": 0.6295467615127563,
-      "eval_runtime": 2.241,
-      "eval_samples_per_second": 27.666,
-      "eval_steps_per_second": 1.785,
       "step": 110
     },
     {
       "epoch": 20.91,
-      "eval_accuracy": 0.7580645161290323,
-      "eval_loss": 0.6735957264900208,
-      "eval_runtime": 2.3026,
-      "eval_samples_per_second": 26.926,
-      "eval_steps_per_second": 1.737,
       "step": 115
     },
     {
       "epoch": 21.82,
-      "learning_rate": 1.6888888888888888e-05,
-      "loss": 0.4958,
       "step": 120
     },
     {
       "epoch": 22.0,
-      "eval_accuracy": 0.7903225806451613,
-      "eval_loss": 0.6217902302742004,
-      "eval_runtime": 2.2946,
-      "eval_samples_per_second": 27.02,
-      "eval_steps_per_second": 1.743,
       "step": 121
     },
     {
       "epoch": 22.91,
-      "eval_accuracy": 0.7741935483870968,
-      "eval_loss": 0.6400670409202576,
-      "eval_runtime": 2.217,
-      "eval_samples_per_second": 27.965,
-      "eval_steps_per_second": 1.804,
       "step": 126
     },
     {
       "epoch": 23.64,
-      "learning_rate": 1.4777777777777778e-05,
-      "loss": 0.4561,
       "step": 130
     },
     {
       "epoch": 24.0,
-      "eval_accuracy": 0.7258064516129032,
-      "eval_loss": 0.6640270352363586,
-      "eval_runtime": 2.199,
-      "eval_samples_per_second": 28.194,
-      "eval_steps_per_second": 1.819,
       "step": 132
     },
     {
       "epoch": 24.91,
-      "eval_accuracy": 0.7741935483870968,
-      "eval_loss": 0.6009158492088318,
-      "eval_runtime": 2.2165,
-      "eval_samples_per_second": 27.972,
-      "eval_steps_per_second": 1.805,
       "step": 137
     },
     {
       "epoch": 25.45,
-      "learning_rate": 1.2666666666666667e-05,
-      "loss": 0.4149,
       "step": 140
     },
     {
       "epoch": 26.0,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5619057416915894,
-      "eval_runtime": 2.2799,
-      "eval_samples_per_second": 27.194,
-      "eval_steps_per_second": 1.754,
       "step": 143
     },
     {
       "epoch": 26.91,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5118472576141357,
-      "eval_runtime": 2.1675,
-      "eval_samples_per_second": 28.604,
-      "eval_steps_per_second": 1.845,
       "step": 148
     },
     {
       "epoch": 27.27,
-      "learning_rate": 1.0555555555555557e-05,
-      "loss": 0.3965,
       "step": 150
     },
     {
       "epoch": 28.0,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5682212114334106,
-      "eval_runtime": 2.2446,
-      "eval_samples_per_second": 27.622,
-      "eval_steps_per_second": 1.782,
       "step": 154
     },
     {
       "epoch": 28.91,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5514592528343201,
-      "eval_runtime": 2.2005,
-      "eval_samples_per_second": 28.175,
-      "eval_steps_per_second": 1.818,
       "step": 159
     },
     {
       "epoch": 29.09,
-      "learning_rate": 8.444444444444444e-06,
-      "loss": 0.4219,
       "step": 160
     },
     {
       "epoch": 30.0,
-      "eval_accuracy": 0.7096774193548387,
-      "eval_loss": 0.7044903039932251,
-      "eval_runtime": 2.2835,
-      "eval_samples_per_second": 27.151,
-      "eval_steps_per_second": 1.752,
       "step": 165
     },
     {
       "epoch": 30.91,
-      "learning_rate": 6.333333333333333e-06,
-      "loss": 0.3939,
       "step": 170
     },
     {
       "epoch": 30.91,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5711750984191895,
-      "eval_runtime": 2.2085,
-      "eval_samples_per_second": 28.073,
-      "eval_steps_per_second": 1.811,
       "step": 170
     },
     {
       "epoch": 32.0,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5857284069061279,
-      "eval_runtime": 2.3796,
-      "eval_samples_per_second": 26.055,
       "eval_steps_per_second": 1.681,
       "step": 176
     },
     {
       "epoch": 32.73,
-      "learning_rate": 4.222222222222222e-06,
-      "loss": 0.3598,
       "step": 180
     },
     {
       "epoch": 32.91,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5539482235908508,
-      "eval_runtime": 2.3201,
-      "eval_samples_per_second": 26.724,
-      "eval_steps_per_second": 1.724,
       "step": 181
     },
     {
       "epoch": 34.0,
-      "eval_accuracy": 0.8225806451612904,
-      "eval_loss": 0.5470647215843201,
-      "eval_runtime": 2.1645,
-      "eval_samples_per_second": 28.644,
-      "eval_steps_per_second": 1.848,
       "step": 187
     },
     {
       "epoch": 34.55,
-      "learning_rate": 2.111111111111111e-06,
-      "loss": 0.3613,
       "step": 190
     },
     {
       "epoch": 34.91,
-      "eval_accuracy": 0.8225806451612904,
-      "eval_loss": 0.5407957434654236,
-      "eval_runtime": 2.233,
-      "eval_samples_per_second": 27.765,
-      "eval_steps_per_second": 1.791,
       "step": 192
     },
     {
       "epoch": 36.0,
-      "eval_accuracy": 0.8387096774193549,
-      "eval_loss": 0.5388934016227722,
-      "eval_runtime": 2.3576,
-      "eval_samples_per_second": 26.298,
-      "eval_steps_per_second": 1.697,
       "step": 198
     },
     {
       "epoch": 36.36,
       "learning_rate": 0.0,
-      "loss": 0.3748,
       "step": 200
     },
     {
       "epoch": 36.36,
-      "eval_accuracy": 0.8387096774193549,
-      "eval_loss": 0.538964569568634,
-      "eval_runtime": 2.198,
-      "eval_samples_per_second": 28.207,
-      "eval_steps_per_second": 1.82,
       "step": 200
     },
     {
       "epoch": 36.36,
       "step": 200,
       "total_flos": 9.859141601338982e+17,
-      "train_loss": 0.7515219366550445,
-      "train_runtime": 697.4947,
-      "train_samples_per_second": 20.072,
-      "train_steps_per_second": 0.287
     }
   ],
   "logging_steps": 10,

 {
+  "best_metric": 0.9032258064516129,
+  "best_model_checkpoint": "beit-base-patch16-224-OT-alt\\checkpoint-99",
   "epoch": 36.36363636363637,
   "eval_steps": 500,
   "global_step": 200,
   "log_history": [
     {
       "epoch": 0.91,
+      "eval_accuracy": 0.1774193548387097,
+      "eval_loss": 1.7093149423599243,
+      "eval_runtime": 2.3415,
+      "eval_samples_per_second": 26.478,
+      "eval_steps_per_second": 1.708,
       "step": 5
     },
     {
       "epoch": 1.82,
+      "learning_rate": 2.5e-05,
+      "loss": 1.7744,
       "step": 10
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.1774193548387097,
+      "eval_loss": 1.6177618503570557,
+      "eval_runtime": 2.3771,
+      "eval_samples_per_second": 26.083,
+      "eval_steps_per_second": 1.683,
       "step": 11
     },
     {
       "epoch": 2.91,
+      "eval_accuracy": 0.1774193548387097,
+      "eval_loss": 1.473004698753357,
+      "eval_runtime": 2.3411,
+      "eval_samples_per_second": 26.484,
+      "eval_steps_per_second": 1.709,
       "step": 16
     },
     {
       "epoch": 3.64,
+      "learning_rate": 5e-05,
+      "loss": 1.5823,
       "step": 20
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.1774193548387097,
+      "eval_loss": 1.2754011154174805,
+      "eval_runtime": 2.3296,
+      "eval_samples_per_second": 26.614,
+      "eval_steps_per_second": 1.717,
       "step": 22
     },
     {
       "epoch": 4.91,
+      "eval_accuracy": 0.5645161290322581,
+      "eval_loss": 1.1454869508743286,
+      "eval_runtime": 2.374,
+      "eval_samples_per_second": 26.117,
+      "eval_steps_per_second": 1.685,
       "step": 27
     },
     {
       "epoch": 5.45,
+      "learning_rate": 4.722222222222222e-05,
+      "loss": 1.27,
       "step": 30
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.6290322580645161,
+      "eval_loss": 1.0146747827529907,
+      "eval_runtime": 2.4966,
+      "eval_samples_per_second": 24.834,
+      "eval_steps_per_second": 1.602,
       "step": 33
     },
     {
       "epoch": 6.91,
+      "eval_accuracy": 0.5483870967741935,
+      "eval_loss": 0.9789792895317078,
+      "eval_runtime": 2.3346,
+      "eval_samples_per_second": 26.557,
+      "eval_steps_per_second": 1.713,
       "step": 38
     },
     {
       "epoch": 7.27,
+      "learning_rate": 4.4444444444444447e-05,
+      "loss": 1.079,
       "step": 40
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.45161290322580644,
+      "eval_loss": 1.0473968982696533,
+      "eval_runtime": 2.3881,
+      "eval_samples_per_second": 25.962,
+      "eval_steps_per_second": 1.675,
       "step": 44
     },
     {
       "epoch": 8.91,
+      "eval_accuracy": 0.7580645161290323,
+      "eval_loss": 0.8796324729919434,
+      "eval_runtime": 2.3814,
+      "eval_samples_per_second": 26.035,
+      "eval_steps_per_second": 1.68,
       "step": 49
     },
     {
       "epoch": 9.09,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 1.005,
       "step": 50
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.7741935483870968,
+      "eval_loss": 0.7759426832199097,
+      "eval_runtime": 2.3246,
+      "eval_samples_per_second": 26.672,
+      "eval_steps_per_second": 1.721,
       "step": 55
     },
     {
       "epoch": 10.91,
+      "learning_rate": 3.888888888888889e-05,
+      "loss": 0.8479,
       "step": 60
     },
     {
       "epoch": 10.91,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.7421430349349976,
+      "eval_runtime": 2.3181,
+      "eval_samples_per_second": 26.747,
+      "eval_steps_per_second": 1.726,
       "step": 60
     },
     {
       "epoch": 12.0,
+      "eval_accuracy": 0.8548387096774194,
+      "eval_loss": 0.6759869456291199,
+      "eval_runtime": 2.3471,
+      "eval_samples_per_second": 26.416,
+      "eval_steps_per_second": 1.704,
       "step": 66
     },
     {
       "epoch": 12.73,
+      "learning_rate": 3.611111111111111e-05,
+      "loss": 0.7695,
       "step": 70
     },
     {
       "epoch": 12.91,
+      "eval_accuracy": 0.8387096774193549,
+      "eval_loss": 0.5932707190513611,
+      "eval_runtime": 2.3526,
+      "eval_samples_per_second": 26.354,
+      "eval_steps_per_second": 1.7,
       "step": 71
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.7741935483870968,
+      "eval_loss": 0.6372359991073608,
+      "eval_runtime": 2.2975,
+      "eval_samples_per_second": 26.985,
+      "eval_steps_per_second": 1.741,
       "step": 77
     },
     {
       "epoch": 14.55,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.6591,
       "step": 80
     },
     {
       "epoch": 14.91,
+      "eval_accuracy": 0.8387096774193549,
+      "eval_loss": 0.5653398633003235,
+      "eval_runtime": 2.2901,
+      "eval_samples_per_second": 27.074,
+      "eval_steps_per_second": 1.747,
       "step": 82
     },
     {
       "epoch": 16.0,
+      "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.4950495958328247,
+      "eval_runtime": 2.4381,
+      "eval_samples_per_second": 25.43,
+      "eval_steps_per_second": 1.641,
       "step": 88
     },
     {
       "epoch": 16.36,
+      "learning_rate": 3.055555555555556e-05,
+      "loss": 0.5675,
       "step": 90
     },
     {
       "epoch": 16.91,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.5040029287338257,
+      "eval_runtime": 2.3556,
+      "eval_samples_per_second": 26.321,
+      "eval_steps_per_second": 1.698,
       "step": 93
     },
     {
       "epoch": 18.0,
+      "eval_accuracy": 0.9032258064516129,
+      "eval_loss": 0.4273931682109833,
+      "eval_runtime": 2.3296,
+      "eval_samples_per_second": 26.614,
+      "eval_steps_per_second": 1.717,
       "step": 99
     },
     {
       "epoch": 18.18,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.5134,
       "step": 100
     },
     {
       "epoch": 18.91,
+      "eval_accuracy": 0.8548387096774194,
+      "eval_loss": 0.461721807718277,
+      "eval_runtime": 2.4876,
+      "eval_samples_per_second": 24.923,
+      "eval_steps_per_second": 1.608,
       "step": 104
     },
     {
       "epoch": 20.0,
+      "learning_rate": 2.5e-05,
+      "loss": 0.4418,
       "step": 110
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.8870967741935484,
+      "eval_loss": 0.4244731366634369,
+      "eval_runtime": 2.3501,
+      "eval_samples_per_second": 26.382,
+      "eval_steps_per_second": 1.702,
       "step": 110
     },
     {
       "epoch": 20.91,
+      "eval_accuracy": 0.8387096774193549,
+      "eval_loss": 0.4922010600566864,
+      "eval_runtime": 2.4186,
+      "eval_samples_per_second": 25.635,
+      "eval_steps_per_second": 1.654,
       "step": 115
     },
     {
       "epoch": 21.82,
+      "learning_rate": 2.2222222222222223e-05,
+      "loss": 0.402,
       "step": 120
     },
     {
       "epoch": 22.0,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.5112457275390625,
+      "eval_runtime": 2.4655,
+      "eval_samples_per_second": 25.147,
+      "eval_steps_per_second": 1.622,
       "step": 121
     },
     {
       "epoch": 22.91,
+      "eval_accuracy": 0.8548387096774194,
+      "eval_loss": 0.46961790323257446,
+      "eval_runtime": 2.2816,
+      "eval_samples_per_second": 27.174,
+      "eval_steps_per_second": 1.753,
       "step": 126
     },
     {
       "epoch": 23.64,
+      "learning_rate": 1.9444444444444445e-05,
+      "loss": 0.4039,
       "step": 130
     },
     {
       "epoch": 24.0,
+      "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.40138500928878784,
+      "eval_runtime": 2.3996,
+      "eval_samples_per_second": 25.838,
+      "eval_steps_per_second": 1.667,
       "step": 132
     },
     {
       "epoch": 24.91,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.5005894899368286,
+      "eval_runtime": 2.3451,
+      "eval_samples_per_second": 26.439,
+      "eval_steps_per_second": 1.706,
       "step": 137
     },
     {
       "epoch": 25.45,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.4216,
       "step": 140
     },
     {
       "epoch": 26.0,
+      "eval_accuracy": 0.8548387096774194,
+      "eval_loss": 0.5351113080978394,
+      "eval_runtime": 2.4946,
+      "eval_samples_per_second": 24.853,
+      "eval_steps_per_second": 1.603,
       "step": 143
     },
     {
       "epoch": 26.91,
+      "eval_accuracy": 0.8548387096774194,
+      "eval_loss": 0.5202920436859131,
+      "eval_runtime": 2.3236,
+      "eval_samples_per_second": 26.683,
+      "eval_steps_per_second": 1.721,
       "step": 148
     },
     {
       "epoch": 27.27,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 0.3593,
       "step": 150
     },
     {
       "epoch": 28.0,
+      "eval_accuracy": 0.8548387096774194,
+      "eval_loss": 0.4081813395023346,
+      "eval_runtime": 2.3351,
+      "eval_samples_per_second": 26.552,
+      "eval_steps_per_second": 1.713,
       "step": 154
     },
     {
       "epoch": 28.91,
+      "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.40170377492904663,
+      "eval_runtime": 2.3078,
+      "eval_samples_per_second": 26.865,
+      "eval_steps_per_second": 1.733,
       "step": 159
     },
     {
       "epoch": 29.09,
+      "learning_rate": 1.1111111111111112e-05,
+      "loss": 0.3638,
       "step": 160
     },
     {
       "epoch": 30.0,
+      "eval_accuracy": 0.8870967741935484,
+      "eval_loss": 0.40682506561279297,
+      "eval_runtime": 2.5896,
+      "eval_samples_per_second": 23.942,
+      "eval_steps_per_second": 1.545,
       "step": 165
     },
     {
       "epoch": 30.91,
+      "learning_rate": 8.333333333333334e-06,
+      "loss": 0.3509,
       "step": 170
     },
     {
       "epoch": 30.91,
+      "eval_accuracy": 0.8870967741935484,
+      "eval_loss": 0.3990916311740875,
+      "eval_runtime": 2.75,
+      "eval_samples_per_second": 22.546,
+      "eval_steps_per_second": 1.455,
       "step": 170
     },
     {
       "epoch": 32.0,
+      "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.3964940309524536,
+      "eval_runtime": 2.3794,
+      "eval_samples_per_second": 26.056,
       "eval_steps_per_second": 1.681,
       "step": 176
     },
     {
       "epoch": 32.73,
+      "learning_rate": 5.555555555555556e-06,
+      "loss": 0.3426,
       "step": 180
     },
     {
       "epoch": 32.91,
+      "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.3921041190624237,
+      "eval_runtime": 2.3356,
+      "eval_samples_per_second": 26.546,
+      "eval_steps_per_second": 1.713,
       "step": 181
     },
     {
       "epoch": 34.0,
+      "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.39981809258461,
+      "eval_runtime": 2.4784,
+      "eval_samples_per_second": 25.016,
+      "eval_steps_per_second": 1.614,
       "step": 187
     },
     {
       "epoch": 34.55,
+      "learning_rate": 2.777777777777778e-06,
+      "loss": 0.3253,
       "step": 190
     },
     {
       "epoch": 34.91,
+      "eval_accuracy": 0.8870967741935484,
+      "eval_loss": 0.41015544533729553,
+      "eval_runtime": 2.3626,
+      "eval_samples_per_second": 26.243,
+      "eval_steps_per_second": 1.693,
       "step": 192
     },
     {
       "epoch": 36.0,
+      "eval_accuracy": 0.8870967741935484,
+      "eval_loss": 0.4080694913864136,
+      "eval_runtime": 2.3858,
+      "eval_samples_per_second": 25.987,
+      "eval_steps_per_second": 1.677,
       "step": 198
     },
     {
       "epoch": 36.36,
       "learning_rate": 0.0,
+      "loss": 0.3085,
       "step": 200
     },
     {
       "epoch": 36.36,
+      "eval_accuracy": 0.8870967741935484,
+      "eval_loss": 0.40834033489227295,
+      "eval_runtime": 2.3711,
+      "eval_samples_per_second": 26.149,
+      "eval_steps_per_second": 1.687,
       "step": 200
     },
     {
       "epoch": 36.36,
       "step": 200,
       "total_flos": 9.859141601338982e+17,
+      "train_loss": 0.6893912732601166,
+      "train_runtime": 709.0628,
+      "train_samples_per_second": 19.744,
+      "train_steps_per_second": 0.282
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0b6f66eb1a9e3f3c50c5a51c5595513566317820c38ec61d1d6b26f52be64b51
 size 4728

 version https://git-lfs.github.com/spec/v1
+oid sha256:9485465125f9e78e6dd67b509633fd1622ddef7452bb952f0688e13435966aee
 size 4728