Upload folder using huggingface_hub

by Manasee27 - opened Jul 21, 2023

base: refs/heads/main

←

from: refs/pr/5

Discussion Files changed

+9252

-1041

Files changed (21) hide show

all_results.json +6 -6
checkpoint-1160/config.json +40 -0
checkpoint-1160/optimizer.pt +3 -0
checkpoint-1160/preprocessor_config.json +22 -0
checkpoint-1160/pytorch_model.bin +3 -0
checkpoint-1160/rng_state.pth +3 -0
checkpoint-1160/scheduler.pt +3 -0
checkpoint-1160/trainer_state.json +973 -0
checkpoint-1160/training_args.bin +3 -0
checkpoint-5840/config.json +40 -0
checkpoint-5840/optimizer.pt +3 -0
checkpoint-5840/preprocessor_config.json +22 -0
checkpoint-5840/pytorch_model.bin +3 -0
checkpoint-5840/rng_state.pth +3 -0
checkpoint-5840/scheduler.pt +3 -0
checkpoint-5840/trainer_state.json +0 -0
checkpoint-5840/training_args.bin +3 -0
pytorch_model.bin +1 -1
train_results.json +6 -6
trainer_state.json +0 -0
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 8.0,
-    "total_flos": 3.8629591832685773e+18,
-    "train_loss": 0.2533179052472592,
-    "train_runtime": 4957.8804,
-    "train_samples_per_second": 10.069,
-    "train_steps_per_second": 0.629
 }

 {
+    "epoch": 15.0,
+    "total_flos": 7.243048468628582e+18,
+    "train_loss": 0.1559911989340654,
+    "train_runtime": 9254.6234,
+    "train_samples_per_second": 10.114,
+    "train_steps_per_second": 0.632
 }

checkpoint-1160/config.json ADDED Viewed

	@@ -0,0 +1,40 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Brazil",
+    "1": "Canada",
+    "2": "Finland",
+    "3": "Japan",
+    "4": "United-Kingdom",
+    "5": "United_States"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Brazil": "0",
+    "Canada": "1",
+    "Finland": "2",
+    "Japan": "3",
+    "United-Kingdom": "4",
+    "United_States": "5"
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0"
+}

checkpoint-1160/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b662c58d7407b3c58eb022c58ceb753887abd4e03814229f9dffa4dcbde4492
+size 686537861

checkpoint-1160/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

checkpoint-1160/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da704a6cb51e648486e5245ffa315bac0c7f02bb9187d11294f3945a898fb971
+size 343278253

checkpoint-1160/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9f17574b458d75c9fb9942b59ba069fba448afd09ba95fb17bda6ac6d4ece4d
+size 13617

checkpoint-1160/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d26209d1092214d771860d51e59eb1362f4afe3902eb12c7eddc6b4d9bf3b34e
+size 627

checkpoint-1160/trainer_state.json ADDED Viewed

	@@ -0,0 +1,973 @@

+{
+  "best_metric": 0.6604002714157104,
+  "best_model_checkpoint": "./vit-base-beans/checkpoint-1160",
+  "epoch": 2.9743589743589745,
+  "global_step": 1160,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.03,
+      "learning_rate": 0.00019965811965811967,
+      "loss": 1.7468,
+      "step": 10
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.00019931623931623932,
+      "loss": 1.653,
+      "step": 20
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 0.00019897435897435898,
+      "loss": 1.5026,
+      "step": 30
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.00019863247863247864,
+      "loss": 1.4296,
+      "step": 40
+    },
+    {
+      "epoch": 0.1,
+      "eval_accuracy": 0.41975308641975306,
+      "eval_loss": 1.4691457748413086,
+      "eval_runtime": 61.6215,
+      "eval_samples_per_second": 57.902,
+      "eval_steps_per_second": 7.238,
+      "step": 40
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 0.0001982905982905983,
+      "loss": 1.369,
+      "step": 50
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00019794871794871796,
+      "loss": 1.2948,
+      "step": 60
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 0.0001976068376068376,
+      "loss": 1.3074,
+      "step": 70
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 0.00019726495726495727,
+      "loss": 1.3074,
+      "step": 80
+    },
+    {
+      "epoch": 0.21,
+      "eval_accuracy": 0.5549943883277216,
+      "eval_loss": 1.1999692916870117,
+      "eval_runtime": 33.0603,
+      "eval_samples_per_second": 107.924,
+      "eval_steps_per_second": 13.491,
+      "step": 80
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 0.00019692307692307696,
+      "loss": 1.1725,
+      "step": 90
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.00019658119658119659,
+      "loss": 1.1944,
+      "step": 100
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 0.00019623931623931624,
+      "loss": 1.18,
+      "step": 110
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.0001958974358974359,
+      "loss": 1.1731,
+      "step": 120
+    },
+    {
+      "epoch": 0.31,
+      "eval_accuracy": 0.6689113355780022,
+      "eval_loss": 0.978410005569458,
+      "eval_runtime": 37.0531,
+      "eval_samples_per_second": 96.294,
+      "eval_steps_per_second": 12.037,
+      "step": 120
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 0.00019555555555555556,
+      "loss": 0.9441,
+      "step": 130
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.00019521367521367522,
+      "loss": 1.0459,
+      "step": 140
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 0.00019487179487179487,
+      "loss": 1.1109,
+      "step": 150
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00019452991452991453,
+      "loss": 1.0094,
+      "step": 160
+    },
+    {
+      "epoch": 0.41,
+      "eval_accuracy": 0.6616161616161617,
+      "eval_loss": 0.9483916759490967,
+      "eval_runtime": 32.6783,
+      "eval_samples_per_second": 109.185,
+      "eval_steps_per_second": 13.648,
+      "step": 160
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 0.0001941880341880342,
+      "loss": 0.9165,
+      "step": 170
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.00019384615384615385,
+      "loss": 1.0904,
+      "step": 180
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 0.0001935042735042735,
+      "loss": 0.9846,
+      "step": 190
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00019316239316239316,
+      "loss": 1.0908,
+      "step": 200
+    },
+    {
+      "epoch": 0.51,
+      "eval_accuracy": 0.5454545454545454,
+      "eval_loss": 1.2091434001922607,
+      "eval_runtime": 32.1465,
+      "eval_samples_per_second": 110.992,
+      "eval_steps_per_second": 13.874,
+      "step": 200
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 0.00019282051282051282,
+      "loss": 1.0193,
+      "step": 210
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0001924786324786325,
+      "loss": 0.9809,
+      "step": 220
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 0.00019213675213675216,
+      "loss": 0.9673,
+      "step": 230
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 0.00019179487179487182,
+      "loss": 0.9402,
+      "step": 240
+    },
+    {
+      "epoch": 0.62,
+      "eval_accuracy": 0.6481481481481481,
+      "eval_loss": 0.9721583724021912,
+      "eval_runtime": 33.9462,
+      "eval_samples_per_second": 105.107,
+      "eval_steps_per_second": 13.138,
+      "step": 240
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 0.00019145299145299148,
+      "loss": 0.8103,
+      "step": 250
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 0.00019111111111111114,
+      "loss": 0.8564,
+      "step": 260
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 0.0001907692307692308,
+      "loss": 1.1074,
+      "step": 270
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 0.00019042735042735042,
+      "loss": 1.044,
+      "step": 280
+    },
+    {
+      "epoch": 0.72,
+      "eval_accuracy": 0.5897867564534232,
+      "eval_loss": 1.1147791147232056,
+      "eval_runtime": 32.6846,
+      "eval_samples_per_second": 109.164,
+      "eval_steps_per_second": 13.646,
+      "step": 280
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 0.00019008547008547008,
+      "loss": 1.016,
+      "step": 290
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 0.00018974358974358974,
+      "loss": 0.8815,
+      "step": 300
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 0.0001894017094017094,
+      "loss": 0.8718,
+      "step": 310
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 0.00018905982905982906,
+      "loss": 0.6886,
+      "step": 320
+    },
+    {
+      "epoch": 0.82,
+      "eval_accuracy": 0.7272727272727273,
+      "eval_loss": 0.7878678441047668,
+      "eval_runtime": 31.1497,
+      "eval_samples_per_second": 114.544,
+      "eval_steps_per_second": 14.318,
+      "step": 320
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 0.0001887179487179487,
+      "loss": 0.8122,
+      "step": 330
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 0.00018837606837606837,
+      "loss": 0.6107,
+      "step": 340
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 0.00018803418803418803,
+      "loss": 0.7783,
+      "step": 350
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 0.0001876923076923077,
+      "loss": 0.8432,
+      "step": 360
+    },
+    {
+      "epoch": 0.92,
+      "eval_accuracy": 0.7480359147025814,
+      "eval_loss": 0.7056980729103088,
+      "eval_runtime": 32.2533,
+      "eval_samples_per_second": 110.624,
+      "eval_steps_per_second": 13.828,
+      "step": 360
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 0.00018735042735042737,
+      "loss": 0.8314,
+      "step": 370
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 0.00018700854700854703,
+      "loss": 0.8488,
+      "step": 380
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 0.0001866666666666667,
+      "loss": 0.8547,
+      "step": 390
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 0.00018632478632478634,
+      "loss": 0.7394,
+      "step": 400
+    },
+    {
+      "epoch": 1.03,
+      "eval_accuracy": 0.6835016835016835,
+      "eval_loss": 0.9139666557312012,
+      "eval_runtime": 42.9913,
+      "eval_samples_per_second": 82.994,
+      "eval_steps_per_second": 10.374,
+      "step": 400
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 0.000185982905982906,
+      "loss": 0.5767,
+      "step": 410
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 0.00018564102564102566,
+      "loss": 0.5304,
+      "step": 420
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 0.00018529914529914532,
+      "loss": 0.6296,
+      "step": 430
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 0.00018495726495726497,
+      "loss": 0.6004,
+      "step": 440
+    },
+    {
+      "epoch": 1.13,
+      "eval_accuracy": 0.7255892255892256,
+      "eval_loss": 0.7451665997505188,
+      "eval_runtime": 31.8253,
+      "eval_samples_per_second": 112.112,
+      "eval_steps_per_second": 14.014,
+      "step": 440
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 0.00018461538461538463,
+      "loss": 0.518,
+      "step": 450
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 0.00018427350427350426,
+      "loss": 0.5825,
+      "step": 460
+    },
+    {
+      "epoch": 1.21,
+      "learning_rate": 0.00018393162393162392,
+      "loss": 0.5465,
+      "step": 470
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 0.00018358974358974358,
+      "loss": 0.5201,
+      "step": 480
+    },
+    {
+      "epoch": 1.23,
+      "eval_accuracy": 0.6879910213243546,
+      "eval_loss": 0.8496339917182922,
+      "eval_runtime": 33.617,
+      "eval_samples_per_second": 106.137,
+      "eval_steps_per_second": 13.267,
+      "step": 480
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 0.00018324786324786324,
+      "loss": 0.5016,
+      "step": 490
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 0.00018290598290598292,
+      "loss": 0.6101,
+      "step": 500
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 0.00018256410256410258,
+      "loss": 0.5572,
+      "step": 510
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 0.00018222222222222224,
+      "loss": 0.4039,
+      "step": 520
+    },
+    {
+      "epoch": 1.33,
+      "eval_accuracy": 0.7312008978675645,
+      "eval_loss": 0.7843908071517944,
+      "eval_runtime": 31.7575,
+      "eval_samples_per_second": 112.351,
+      "eval_steps_per_second": 14.044,
+      "step": 520
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 0.0001818803418803419,
+      "loss": 0.4831,
+      "step": 530
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 0.00018153846153846155,
+      "loss": 0.5493,
+      "step": 540
+    },
+    {
+      "epoch": 1.41,
+      "learning_rate": 0.0001811965811965812,
+      "loss": 0.4942,
+      "step": 550
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 0.00018085470085470087,
+      "loss": 0.4475,
+      "step": 560
+    },
+    {
+      "epoch": 1.44,
+      "eval_accuracy": 0.6593714927048261,
+      "eval_loss": 0.9572438597679138,
+      "eval_runtime": 31.2916,
+      "eval_samples_per_second": 114.024,
+      "eval_steps_per_second": 14.253,
+      "step": 560
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 0.00018051282051282052,
+      "loss": 0.4667,
+      "step": 570
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 0.00018017094017094018,
+      "loss": 0.4685,
+      "step": 580
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 0.00017982905982905984,
+      "loss": 0.5028,
+      "step": 590
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 0.0001794871794871795,
+      "loss": 0.6071,
+      "step": 600
+    },
+    {
+      "epoch": 1.54,
+      "eval_accuracy": 0.7676767676767676,
+      "eval_loss": 0.6666165590286255,
+      "eval_runtime": 32.2041,
+      "eval_samples_per_second": 110.793,
+      "eval_steps_per_second": 13.849,
+      "step": 600
+    },
+    {
+      "epoch": 1.56,
+      "learning_rate": 0.00017914529914529916,
+      "loss": 0.5134,
+      "step": 610
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 0.0001788034188034188,
+      "loss": 0.658,
+      "step": 620
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.00017846153846153847,
+      "loss": 0.606,
+      "step": 630
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 0.00017811965811965813,
+      "loss": 0.5004,
+      "step": 640
+    },
+    {
+      "epoch": 1.64,
+      "eval_accuracy": 0.7373737373737373,
+      "eval_loss": 0.7380097508430481,
+      "eval_runtime": 32.5063,
+      "eval_samples_per_second": 109.763,
+      "eval_steps_per_second": 13.72,
+      "step": 640
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 0.00017777777777777779,
+      "loss": 0.5404,
+      "step": 650
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 0.00017743589743589744,
+      "loss": 0.5775,
+      "step": 660
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 0.0001770940170940171,
+      "loss": 0.5013,
+      "step": 670
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 0.00017675213675213676,
+      "loss": 0.6024,
+      "step": 680
+    },
+    {
+      "epoch": 1.74,
+      "eval_accuracy": 0.7407407407407407,
+      "eval_loss": 0.7545998692512512,
+      "eval_runtime": 36.6802,
+      "eval_samples_per_second": 97.273,
+      "eval_steps_per_second": 12.159,
+      "step": 680
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 0.00017641025641025642,
+      "loss": 0.4815,
+      "step": 690
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 0.00017606837606837607,
+      "loss": 0.4727,
+      "step": 700
+    },
+    {
+      "epoch": 1.82,
+      "learning_rate": 0.00017572649572649573,
+      "loss": 0.4698,
+      "step": 710
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 0.0001753846153846154,
+      "loss": 0.4813,
+      "step": 720
+    },
+    {
+      "epoch": 1.85,
+      "eval_accuracy": 0.7609427609427609,
+      "eval_loss": 0.7190226912498474,
+      "eval_runtime": 32.2305,
+      "eval_samples_per_second": 110.702,
+      "eval_steps_per_second": 13.838,
+      "step": 720
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 0.00017504273504273505,
+      "loss": 0.5407,
+      "step": 730
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 0.0001747008547008547,
+      "loss": 0.4137,
+      "step": 740
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 0.00017435897435897436,
+      "loss": 0.5252,
+      "step": 750
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 0.00017401709401709402,
+      "loss": 0.5608,
+      "step": 760
+    },
+    {
+      "epoch": 1.95,
+      "eval_accuracy": 0.7283950617283951,
+      "eval_loss": 0.7672268748283386,
+      "eval_runtime": 34.3059,
+      "eval_samples_per_second": 104.006,
+      "eval_steps_per_second": 13.001,
+      "step": 760
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 0.00017367521367521368,
+      "loss": 0.4692,
+      "step": 770
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 0.00017333333333333334,
+      "loss": 0.488,
+      "step": 780
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 0.000172991452991453,
+      "loss": 0.3798,
+      "step": 790
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 0.00017264957264957268,
+      "loss": 0.3272,
+      "step": 800
+    },
+    {
+      "epoch": 2.05,
+      "eval_accuracy": 0.7497194163860831,
+      "eval_loss": 0.7055391073226929,
+      "eval_runtime": 34.4041,
+      "eval_samples_per_second": 103.709,
+      "eval_steps_per_second": 12.964,
+      "step": 800
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 0.00017230769230769234,
+      "loss": 0.2257,
+      "step": 810
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 0.000171965811965812,
+      "loss": 0.238,
+      "step": 820
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 0.00017162393162393162,
+      "loss": 0.3225,
+      "step": 830
+    },
+    {
+      "epoch": 2.15,
+      "learning_rate": 0.00017128205128205128,
+      "loss": 0.2803,
+      "step": 840
+    },
+    {
+      "epoch": 2.15,
+      "eval_accuracy": 0.7514029180695847,
+      "eval_loss": 0.7669840455055237,
+      "eval_runtime": 32.953,
+      "eval_samples_per_second": 108.275,
+      "eval_steps_per_second": 13.534,
+      "step": 840
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 0.00017094017094017094,
+      "loss": 0.234,
+      "step": 850
+    },
+    {
+      "epoch": 2.21,
+      "learning_rate": 0.0001705982905982906,
+      "loss": 0.2201,
+      "step": 860
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 0.00017025641025641026,
+      "loss": 0.4651,
+      "step": 870
+    },
+    {
+      "epoch": 2.26,
+      "learning_rate": 0.0001699145299145299,
+      "loss": 0.4051,
+      "step": 880
+    },
+    {
+      "epoch": 2.26,
+      "eval_accuracy": 0.7620650953984287,
+      "eval_loss": 0.691470205783844,
+      "eval_runtime": 37.2444,
+      "eval_samples_per_second": 95.8,
+      "eval_steps_per_second": 11.975,
+      "step": 880
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 0.00016957264957264957,
+      "loss": 0.3069,
+      "step": 890
+    },
+    {
+      "epoch": 2.31,
+      "learning_rate": 0.00016923076923076923,
+      "loss": 0.2787,
+      "step": 900
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 0.00016888888888888889,
+      "loss": 0.2794,
+      "step": 910
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 0.00016854700854700854,
+      "loss": 0.3436,
+      "step": 920
+    },
+    {
+      "epoch": 2.36,
+      "eval_accuracy": 0.7631874298540965,
+      "eval_loss": 0.6948888301849365,
+      "eval_runtime": 32.1442,
+      "eval_samples_per_second": 111.0,
+      "eval_steps_per_second": 13.875,
+      "step": 920
+    },
+    {
+      "epoch": 2.38,
+      "learning_rate": 0.00016820512820512823,
+      "loss": 0.2964,
+      "step": 930
+    },
+    {
+      "epoch": 2.41,
+      "learning_rate": 0.00016786324786324789,
+      "loss": 0.1973,
+      "step": 940
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 0.00016752136752136754,
+      "loss": 0.2257,
+      "step": 950
+    },
+    {
+      "epoch": 2.46,
+      "learning_rate": 0.0001671794871794872,
+      "loss": 0.2759,
+      "step": 960
+    },
+    {
+      "epoch": 2.46,
+      "eval_accuracy": 0.7356902356902357,
+      "eval_loss": 0.8428576588630676,
+      "eval_runtime": 32.8186,
+      "eval_samples_per_second": 108.719,
+      "eval_steps_per_second": 13.59,
+      "step": 960
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 0.00016683760683760686,
+      "loss": 0.272,
+      "step": 970
+    },
+    {
+      "epoch": 2.51,
+      "learning_rate": 0.00016649572649572652,
+      "loss": 0.2721,
+      "step": 980
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 0.00016615384615384617,
+      "loss": 0.1414,
+      "step": 990
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 0.00016581196581196583,
+      "loss": 0.5024,
+      "step": 1000
+    },
+    {
+      "epoch": 2.56,
+      "eval_accuracy": 0.7502805836139169,
+      "eval_loss": 0.8222711086273193,
+      "eval_runtime": 32.7463,
+      "eval_samples_per_second": 108.959,
+      "eval_steps_per_second": 13.62,
+      "step": 1000
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 0.00016547008547008546,
+      "loss": 0.3348,
+      "step": 1010
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 0.00016512820512820512,
+      "loss": 0.3692,
+      "step": 1020
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 0.00016478632478632478,
+      "loss": 0.3981,
+      "step": 1030
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 0.00016444444444444444,
+      "loss": 0.3571,
+      "step": 1040
+    },
+    {
+      "epoch": 2.67,
+      "eval_accuracy": 0.7289562289562289,
+      "eval_loss": 0.8546615839004517,
+      "eval_runtime": 33.6376,
+      "eval_samples_per_second": 106.072,
+      "eval_steps_per_second": 13.259,
+      "step": 1040
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 0.0001641025641025641,
+      "loss": 0.3647,
+      "step": 1050
+    },
+    {
+      "epoch": 2.72,
+      "learning_rate": 0.00016376068376068375,
+      "loss": 0.2547,
+      "step": 1060
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 0.00016341880341880344,
+      "loss": 0.3708,
+      "step": 1070
+    },
+    {
+      "epoch": 2.77,
+      "learning_rate": 0.0001630769230769231,
+      "loss": 0.3197,
+      "step": 1080
+    },
+    {
+      "epoch": 2.77,
+      "eval_accuracy": 0.754769921436588,
+      "eval_loss": 0.7111819982528687,
+      "eval_runtime": 33.1915,
+      "eval_samples_per_second": 107.497,
+      "eval_steps_per_second": 13.437,
+      "step": 1080
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 0.00016273504273504275,
+      "loss": 0.2805,
+      "step": 1090
+    },
+    {
+      "epoch": 2.82,
+      "learning_rate": 0.0001623931623931624,
+      "loss": 0.2792,
+      "step": 1100
+    },
+    {
+      "epoch": 2.85,
+      "learning_rate": 0.00016205128205128207,
+      "loss": 0.3781,
+      "step": 1110
+    },
+    {
+      "epoch": 2.87,
+      "learning_rate": 0.00016170940170940172,
+      "loss": 0.3872,
+      "step": 1120
+    },
+    {
+      "epoch": 2.87,
+      "eval_accuracy": 0.7485970819304153,
+      "eval_loss": 0.7666726112365723,
+      "eval_runtime": 33.3793,
+      "eval_samples_per_second": 106.892,
+      "eval_steps_per_second": 13.362,
+      "step": 1120
+    },
+    {
+      "epoch": 2.9,
+      "learning_rate": 0.00016136752136752138,
+      "loss": 0.3489,
+      "step": 1130
+    },
+    {
+      "epoch": 2.92,
+      "learning_rate": 0.00016102564102564104,
+      "loss": 0.3436,
+      "step": 1140
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 0.0001606837606837607,
+      "loss": 0.2608,
+      "step": 1150
+    },
+    {
+      "epoch": 2.97,
+      "learning_rate": 0.00016034188034188036,
+      "loss": 0.2699,
+      "step": 1160
+    },
+    {
+      "epoch": 2.97,
+      "eval_accuracy": 0.7867564534231201,
+      "eval_loss": 0.6604002714157104,
+      "eval_runtime": 42.2756,
+      "eval_samples_per_second": 84.398,
+      "eval_steps_per_second": 10.55,
+      "step": 1160
+    }
+  ],
+  "max_steps": 5850,
+  "num_train_epochs": 15,
+  "total_flos": 1.436907983794053e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1160/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:194957c9272212a5dd16465021ce223f9cefe58567f9b9ca890e75d6f7750cde
+size 3899

checkpoint-5840/config.json ADDED Viewed

	@@ -0,0 +1,40 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Brazil",
+    "1": "Canada",
+    "2": "Finland",
+    "3": "Japan",
+    "4": "United-Kingdom",
+    "5": "United_States"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Brazil": "0",
+    "Canada": "1",
+    "Finland": "2",
+    "Japan": "3",
+    "United-Kingdom": "4",
+    "United_States": "5"
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0"
+}

checkpoint-5840/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bde7a0bf4d257ae44ac48605d2ae3a0a67354ea8b037a597f7064c7cffc45e41
+size 686537861

checkpoint-5840/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

checkpoint-5840/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b39254ce3321347f2fa992e7061fa635851668f8100b4d49561aa48a285de620
+size 343278253

checkpoint-5840/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:67beb3ce02205d9d3840c973461d205613e37446b415453d1436cf577351b657
+size 13617

checkpoint-5840/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33a41b91166721500270623b46bc8ee3fa73aeadd054449d85a1e03325056e11
+size 627

checkpoint-5840/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-5840/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:194957c9272212a5dd16465021ce223f9cefe58567f9b9ca890e75d6f7750cde
+size 3899

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9e4cf7738c400c63d307d24c20ed9c77e1a7e56df0099b73936659a2e13d9670
 size 343278253

 version https://git-lfs.github.com/spec/v1
+oid sha256:da704a6cb51e648486e5245ffa315bac0c7f02bb9187d11294f3945a898fb971
 size 343278253

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 8.0,
-    "total_flos": 3.8629591832685773e+18,
-    "train_loss": 0.2533179052472592,
-    "train_runtime": 4957.8804,
-    "train_samples_per_second": 10.069,
-    "train_steps_per_second": 0.629
 }

 {
+    "epoch": 15.0,
+    "total_flos": 7.243048468628582e+18,
+    "train_loss": 0.1559911989340654,
+    "train_runtime": 9254.6234,
+    "train_samples_per_second": 10.114,
+    "train_steps_per_second": 0.632
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:38c25b2b280e8f8dde2511a004bf1b097d7641bf1aae99dd53711356509cd78e
 size 3899

 version https://git-lfs.github.com/spec/v1
+oid sha256:194957c9272212a5dd16465021ce223f9cefe58567f9b9ca890e75d6f7750cde
 size 3899