Upload folder using huggingface_hub

by edmundmills - opened Aug 2, 2023

base: refs/heads/main

←

from: refs/pr/2

Discussion Files changed

+675

-14

Files changed (7) hide show

config.json +12 -10
optimizer.pt +3 -0
pytorch_model.bin +2 -2
rng_state.pth +3 -0
scheduler.pt +3 -0
trainer_state.json +650 -0
training_args.bin +2 -2

config.json CHANGED Viewed

@@ -8,14 +8,15 @@
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "id2label": {
-    "0": "1",
-    "1": "2",
-    "2": "3",
-    "3": "4",
-    "4": "5",
-    "5": "6",
-    "6": "7",
-    "7": "8"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
@@ -27,7 +28,8 @@
     "LABEL_4": 4,
     "LABEL_5": 5,
     "LABEL_6": 6,
-    "LABEL_7": 7
   },
   "layer_norm_eps": 1e-07,
   "max_position_embeddings": 512,
@@ -49,7 +51,7 @@
   "relative_attention": true,
   "share_att_key": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.29.2",
   "type_vocab_size": 0,
   "vocab_size": 128100
 }

   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
     "LABEL_4": 4,
     "LABEL_5": 5,
     "LABEL_6": 6,
+    "LABEL_7": 7,
+    "LABEL_8": 8
   },
   "layer_norm_eps": 1e-07,
   "max_position_embeddings": 512,
   "relative_attention": true,
   "share_att_key": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
   "type_vocab_size": 0,
   "vocab_size": 128100
 }

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:23c32774f045051599e224ffdc1af9e9714d98a366bf5cd8e703d88663efa38a
+size 1475550981

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0240dc7a901ffe350f144b6f693cea82b9e3c537d25d14d918bd9b8ef4d5b047
-size 737787193

 version https://git-lfs.github.com/spec/v1
+oid sha256:e66aeda1581b9ec935bfc043d16fe252be9c12fb47acaebf5158d2ac9157ca0b
+size 737785845

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7accdc88685b15ec75ad9685ebdfbcbcb719085daac37c1f0e03703b75aa0efe
+size 14575

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55c42c6a07c8319456d8d4702714c375b84c69d0eb73081a20d0cad687db3316
+size 627

trainer_state.json ADDED Viewed

	@@ -0,0 +1,650 @@

+{
+  "best_metric": 1.0422136783599854,
+  "best_model_checkpoint": "models/deberta-v3-base/1691009101/checkpoint-470",
+  "epoch": 4.986737400530504,
+  "global_step": 470,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 1.9787234042553193e-05,
+      "loss": 2.1681,
+      "step": 5
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 1.9574468085106384e-05,
+      "loss": 2.1189,
+      "step": 10
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1.9361702127659575e-05,
+      "loss": 2.163,
+      "step": 15
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 1.914893617021277e-05,
+      "loss": 2.111,
+      "step": 20
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 1.893617021276596e-05,
+      "loss": 2.1833,
+      "step": 25
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 1.872340425531915e-05,
+      "loss": 2.0812,
+      "step": 30
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 1.8510638297872342e-05,
+      "loss": 2.1295,
+      "step": 35
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 1.8297872340425533e-05,
+      "loss": 2.0143,
+      "step": 40
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 1.8085106382978724e-05,
+      "loss": 2.1968,
+      "step": 45
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 1.7872340425531915e-05,
+      "loss": 1.995,
+      "step": 50
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 1.765957446808511e-05,
+      "loss": 2.0799,
+      "step": 55
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 1.74468085106383e-05,
+      "loss": 1.9155,
+      "step": 60
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 1.723404255319149e-05,
+      "loss": 1.9628,
+      "step": 65
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 1.7021276595744682e-05,
+      "loss": 1.9793,
+      "step": 70
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.6808510638297873e-05,
+      "loss": 1.8198,
+      "step": 75
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 1.6595744680851064e-05,
+      "loss": 1.6043,
+      "step": 80
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 1.6382978723404255e-05,
+      "loss": 1.6209,
+      "step": 85
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 1.6170212765957446e-05,
+      "loss": 1.5354,
+      "step": 90
+    },
+    {
+      "epoch": 1.0,
+      "eval_dignity_contempt_accuracy": 0.797153024911032,
+      "eval_loss": 1.4699641466140747,
+      "eval_mae": 0.5818505338078291,
+      "eval_n_samples": 670,
+      "eval_runtime": 13.4181,
+      "eval_samples_per_second": 49.933,
+      "eval_scorable_accuracy": 0.8776119402985074,
+      "eval_steps_per_second": 6.26,
+      "eval_top_1_accuracy": 0.5223880597014925,
+      "eval_top_2_accuracy": 0.8843416370106761,
+      "step": 94
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 1.595744680851064e-05,
+      "loss": 1.5383,
+      "step": 95
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 1.5744680851063832e-05,
+      "loss": 1.5934,
+      "step": 100
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 1.5531914893617023e-05,
+      "loss": 1.5562,
+      "step": 105
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 1.5319148936170214e-05,
+      "loss": 1.4006,
+      "step": 110
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 1.5106382978723407e-05,
+      "loss": 1.4296,
+      "step": 115
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 1.4893617021276596e-05,
+      "loss": 1.3508,
+      "step": 120
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 1.4680851063829789e-05,
+      "loss": 1.3246,
+      "step": 125
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 1.4468085106382981e-05,
+      "loss": 1.2573,
+      "step": 130
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 1.425531914893617e-05,
+      "loss": 1.4491,
+      "step": 135
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 1.4042553191489363e-05,
+      "loss": 1.2537,
+      "step": 140
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 1.3829787234042556e-05,
+      "loss": 1.3947,
+      "step": 145
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 1.3617021276595745e-05,
+      "loss": 1.282,
+      "step": 150
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 1.3404255319148938e-05,
+      "loss": 1.3167,
+      "step": 155
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 1.3191489361702127e-05,
+      "loss": 1.3456,
+      "step": 160
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 1.297872340425532e-05,
+      "loss": 1.2924,
+      "step": 165
+    },
+    {
+      "epoch": 1.8,
+      "learning_rate": 1.2765957446808513e-05,
+      "loss": 1.4235,
+      "step": 170
+    },
+    {
+      "epoch": 1.86,
+      "learning_rate": 1.2553191489361702e-05,
+      "loss": 1.157,
+      "step": 175
+    },
+    {
+      "epoch": 1.91,
+      "learning_rate": 1.2340425531914895e-05,
+      "loss": 1.1315,
+      "step": 180
+    },
+    {
+      "epoch": 1.96,
+      "learning_rate": 1.2127659574468087e-05,
+      "loss": 1.2265,
+      "step": 185
+    },
+    {
+      "epoch": 1.99,
+      "eval_dignity_contempt_accuracy": 0.8087248322147651,
+      "eval_loss": 1.1996970176696777,
+      "eval_mae": 0.5134228187919463,
+      "eval_n_samples": 670,
+      "eval_runtime": 13.4177,
+      "eval_samples_per_second": 49.934,
+      "eval_scorable_accuracy": 0.9313432835820895,
+      "eval_steps_per_second": 6.26,
+      "eval_top_1_accuracy": 0.5492537313432836,
+      "eval_top_2_accuracy": 0.9328859060402684,
+      "step": 188
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 1.1914893617021277e-05,
+      "loss": 1.1528,
+      "step": 190
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 1.170212765957447e-05,
+      "loss": 1.1732,
+      "step": 195
+    },
+    {
+      "epoch": 2.12,
+      "learning_rate": 1.1489361702127662e-05,
+      "loss": 1.1946,
+      "step": 200
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 1.1276595744680851e-05,
+      "loss": 1.0079,
+      "step": 205
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 1.1063829787234044e-05,
+      "loss": 0.9267,
+      "step": 210
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 1.0851063829787233e-05,
+      "loss": 1.06,
+      "step": 215
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 1.0638297872340426e-05,
+      "loss": 1.0085,
+      "step": 220
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 1.0425531914893619e-05,
+      "loss": 1.0053,
+      "step": 225
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 1.0212765957446808e-05,
+      "loss": 1.0857,
+      "step": 230
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 1e-05,
+      "loss": 0.8903,
+      "step": 235
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 9.787234042553192e-06,
+      "loss": 1.1211,
+      "step": 240
+    },
+    {
+      "epoch": 2.6,
+      "learning_rate": 9.574468085106385e-06,
+      "loss": 1.0351,
+      "step": 245
+    },
+    {
+      "epoch": 2.65,
+      "learning_rate": 9.361702127659576e-06,
+      "loss": 0.9636,
+      "step": 250
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 9.148936170212767e-06,
+      "loss": 0.9087,
+      "step": 255
+    },
+    {
+      "epoch": 2.76,
+      "learning_rate": 8.936170212765958e-06,
+      "loss": 0.9624,
+      "step": 260
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 8.72340425531915e-06,
+      "loss": 0.9403,
+      "step": 265
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 8.510638297872341e-06,
+      "loss": 0.9479,
+      "step": 270
+    },
+    {
+      "epoch": 2.92,
+      "learning_rate": 8.297872340425532e-06,
+      "loss": 0.8829,
+      "step": 275
+    },
+    {
+      "epoch": 2.97,
+      "learning_rate": 8.085106382978723e-06,
+      "loss": 0.992,
+      "step": 280
+    },
+    {
+      "epoch": 2.99,
+      "eval_dignity_contempt_accuracy": 0.8266199649737302,
+      "eval_loss": 1.091895580291748,
+      "eval_mae": 0.4658493870402802,
+      "eval_n_samples": 670,
+      "eval_runtime": 13.4128,
+      "eval_samples_per_second": 49.952,
+      "eval_scorable_accuracy": 0.9059701492537313,
+      "eval_steps_per_second": 6.263,
+      "eval_top_1_accuracy": 0.5776119402985075,
+      "eval_top_2_accuracy": 0.9316987740805605,
+      "step": 282
+    },
+    {
+      "epoch": 3.02,
+      "learning_rate": 7.872340425531916e-06,
+      "loss": 0.9552,
+      "step": 285
+    },
+    {
+      "epoch": 3.08,
+      "learning_rate": 7.659574468085107e-06,
+      "loss": 0.8174,
+      "step": 290
+    },
+    {
+      "epoch": 3.13,
+      "learning_rate": 7.446808510638298e-06,
+      "loss": 0.766,
+      "step": 295
+    },
+    {
+      "epoch": 3.18,
+      "learning_rate": 7.234042553191491e-06,
+      "loss": 0.7773,
+      "step": 300
+    },
+    {
+      "epoch": 3.24,
+      "learning_rate": 7.021276595744682e-06,
+      "loss": 0.9016,
+      "step": 305
+    },
+    {
+      "epoch": 3.29,
+      "learning_rate": 6.808510638297873e-06,
+      "loss": 0.8505,
+      "step": 310
+    },
+    {
+      "epoch": 3.34,
+      "learning_rate": 6.595744680851064e-06,
+      "loss": 0.9318,
+      "step": 315
+    },
+    {
+      "epoch": 3.4,
+      "learning_rate": 6.382978723404256e-06,
+      "loss": 0.7373,
+      "step": 320
+    },
+    {
+      "epoch": 3.45,
+      "learning_rate": 6.170212765957447e-06,
+      "loss": 0.7445,
+      "step": 325
+    },
+    {
+      "epoch": 3.5,
+      "learning_rate": 5.957446808510638e-06,
+      "loss": 0.8805,
+      "step": 330
+    },
+    {
+      "epoch": 3.55,
+      "learning_rate": 5.744680851063831e-06,
+      "loss": 0.7931,
+      "step": 335
+    },
+    {
+      "epoch": 3.61,
+      "learning_rate": 5.531914893617022e-06,
+      "loss": 0.8024,
+      "step": 340
+    },
+    {
+      "epoch": 3.66,
+      "learning_rate": 5.319148936170213e-06,
+      "loss": 0.7106,
+      "step": 345
+    },
+    {
+      "epoch": 3.71,
+      "learning_rate": 5.106382978723404e-06,
+      "loss": 0.7161,
+      "step": 350
+    },
+    {
+      "epoch": 3.77,
+      "learning_rate": 4.893617021276596e-06,
+      "loss": 0.7998,
+      "step": 355
+    },
+    {
+      "epoch": 3.82,
+      "learning_rate": 4.680851063829788e-06,
+      "loss": 0.6772,
+      "step": 360
+    },
+    {
+      "epoch": 3.87,
+      "learning_rate": 4.468085106382979e-06,
+      "loss": 0.7802,
+      "step": 365
+    },
+    {
+      "epoch": 3.93,
+      "learning_rate": 4.255319148936171e-06,
+      "loss": 0.7525,
+      "step": 370
+    },
+    {
+      "epoch": 3.98,
+      "learning_rate": 4.042553191489362e-06,
+      "loss": 0.7967,
+      "step": 375
+    },
+    {
+      "epoch": 4.0,
+      "eval_dignity_contempt_accuracy": 0.8305084745762712,
+      "eval_loss": 1.0538846254348755,
+      "eval_mae": 0.43559322033898307,
+      "eval_n_samples": 670,
+      "eval_runtime": 13.4019,
+      "eval_samples_per_second": 49.993,
+      "eval_scorable_accuracy": 0.926865671641791,
+      "eval_steps_per_second": 6.268,
+      "eval_top_1_accuracy": 0.6044776119402985,
+      "eval_top_2_accuracy": 0.9372881355932203,
+      "step": 377
+    },
+    {
+      "epoch": 4.03,
+      "learning_rate": 3.8297872340425535e-06,
+      "loss": 0.7263,
+      "step": 380
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 3.6170212765957453e-06,
+      "loss": 0.7746,
+      "step": 385
+    },
+    {
+      "epoch": 4.14,
+      "learning_rate": 3.4042553191489363e-06,
+      "loss": 0.7231,
+      "step": 390
+    },
+    {
+      "epoch": 4.19,
+      "learning_rate": 3.191489361702128e-06,
+      "loss": 0.7129,
+      "step": 395
+    },
+    {
+      "epoch": 4.24,
+      "learning_rate": 2.978723404255319e-06,
+      "loss": 0.7609,
+      "step": 400
+    },
+    {
+      "epoch": 4.3,
+      "learning_rate": 2.765957446808511e-06,
+      "loss": 0.7708,
+      "step": 405
+    },
+    {
+      "epoch": 4.35,
+      "learning_rate": 2.553191489361702e-06,
+      "loss": 0.6699,
+      "step": 410
+    },
+    {
+      "epoch": 4.4,
+      "learning_rate": 2.340425531914894e-06,
+      "loss": 0.5928,
+      "step": 415
+    },
+    {
+      "epoch": 4.46,
+      "learning_rate": 2.1276595744680853e-06,
+      "loss": 0.6845,
+      "step": 420
+    },
+    {
+      "epoch": 4.51,
+      "learning_rate": 1.9148936170212767e-06,
+      "loss": 0.6752,
+      "step": 425
+    },
+    {
+      "epoch": 4.56,
+      "learning_rate": 1.7021276595744682e-06,
+      "loss": 0.5874,
+      "step": 430
+    },
+    {
+      "epoch": 4.62,
+      "learning_rate": 1.4893617021276596e-06,
+      "loss": 0.6781,
+      "step": 435
+    },
+    {
+      "epoch": 4.67,
+      "learning_rate": 1.276595744680851e-06,
+      "loss": 0.6023,
+      "step": 440
+    },
+    {
+      "epoch": 4.72,
+      "learning_rate": 1.0638297872340427e-06,
+      "loss": 0.5626,
+      "step": 445
+    },
+    {
+      "epoch": 4.77,
+      "learning_rate": 8.510638297872341e-07,
+      "loss": 0.6321,
+      "step": 450
+    },
+    {
+      "epoch": 4.83,
+      "learning_rate": 6.382978723404255e-07,
+      "loss": 0.6318,
+      "step": 455
+    },
+    {
+      "epoch": 4.88,
+      "learning_rate": 4.2553191489361704e-07,
+      "loss": 0.5816,
+      "step": 460
+    },
+    {
+      "epoch": 4.93,
+      "learning_rate": 2.1276595744680852e-07,
+      "loss": 0.7118,
+      "step": 465
+    },
+    {
+      "epoch": 4.99,
+      "learning_rate": 0.0,
+      "loss": 0.6383,
+      "step": 470
+    },
+    {
+      "epoch": 4.99,
+      "eval_dignity_contempt_accuracy": 0.8398637137989778,
+      "eval_loss": 1.0422136783599854,
+      "eval_mae": 0.42759795570698467,
+      "eval_n_samples": 670,
+      "eval_runtime": 13.4143,
+      "eval_samples_per_second": 49.947,
+      "eval_scorable_accuracy": 0.9223880597014925,
+      "eval_steps_per_second": 6.262,
+      "eval_top_1_accuracy": 0.6119402985074627,
+      "eval_top_2_accuracy": 0.9369676320272572,
+      "step": 470
+    }
+  ],
+  "max_steps": 470,
+  "num_train_epochs": 5,
+  "total_flos": 7904494608261120.0,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:949464b0c2752939fbd03de5a8fb0cbacecb0496c11c82a489d4865feb21017a
-size 3963

 version https://git-lfs.github.com/spec/v1
+oid sha256:29dfdab16090b73b24c6d9632b5dc452f2c65616e861cc77cef737ef36112f3c
+size 4027