Upload folder using huggingface_hub

Browse files

Files changed (17) hide show

README.md +27 -0
checkpoint-32895/config.json +38 -0
checkpoint-32895/model.safetensors +3 -0
checkpoint-32895/optimizer.pt +3 -0
checkpoint-32895/rng_state.pth +3 -0
checkpoint-32895/scheduler.pt +3 -0
checkpoint-32895/trainer_state.json +480 -0
checkpoint-32895/training_args.bin +3 -0
config.json +38 -0
merges.txt +0 -0
model.safetensors +3 -0
special_tokens_map.json +51 -0
tokenizer.json +0 -0
tokenizer_config.json +57 -0
training_args.bin +3 -0
training_params.json +30 -0
vocab.json +0 -0

README.md ADDED Viewed

	@@ -0,0 +1,27 @@

+---
+tags:
+- autotrain
+- text-classification
+widget:
+- text: "I love AutoTrain"
+datasets:
+- autotrain-8s6z2-1g2hg/autotrain-data
+---
+# Model Trained Using AutoTrain
+- Problem type: Text Classification
+## Validation Metrics
+loss: 0.1894965022802353
+f1: 0.9633213150168105
+precision: 0.9603846270512937
+recall: 0.9662760178233535
+auc: 0.9812675754686511
+accuracy: 0.945028386420119

checkpoint-32895/config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "cardiffnlp/twitter-roberta-base-irony",
+  "_num_labels": 2,
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "objective",
+    "1": "subjective"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "objective": 0,
+    "subjective": 1
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

checkpoint-32895/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b8f49a8ffc04c3b84a4598c60063878faf5b7e8095ad4c640b00fd111bb5e7e8
+size 498612824

checkpoint-32895/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b11ea74e7e3d11d467b940f431f34fdd25671e7da8e0dad8e78697d3d137ca76
+size 997345530

checkpoint-32895/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:31eec3cb55c5782e2294a9d5ab36446f81961cf57af52296164cded412d0c063
+size 14244

checkpoint-32895/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a78cd4bac48016fc1d6546504fec20b85960dc04117165a2058b205f9fc89cb1
+size 1064

checkpoint-32895/trainer_state.json ADDED Viewed

	@@ -0,0 +1,480 @@

+{
+  "best_metric": 0.1894965022802353,
+  "best_model_checkpoint": "autotrain-8s6z2-1g2hg/checkpoint-32895",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 32895,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "grad_norm": 3.4229037761688232,
+      "learning_rate": 8.282674772036476e-06,
+      "loss": 0.655,
+      "step": 548
+    },
+    {
+      "epoch": 0.1,
+      "grad_norm": 2.956129789352417,
+      "learning_rate": 1.661094224924012e-05,
+      "loss": 0.5579,
+      "step": 1096
+    },
+    {
+      "epoch": 0.15,
+      "grad_norm": 7.492773056030273,
+      "learning_rate": 2.493920972644377e-05,
+      "loss": 0.4886,
+      "step": 1644
+    },
+    {
+      "epoch": 0.2,
+      "grad_norm": 9.447515487670898,
+      "learning_rate": 3.326747720364742e-05,
+      "loss": 0.4206,
+      "step": 2192
+    },
+    {
+      "epoch": 0.25,
+      "grad_norm": 10.904797554016113,
+      "learning_rate": 4.158054711246201e-05,
+      "loss": 0.4038,
+      "step": 2740
+    },
+    {
+      "epoch": 0.3,
+      "grad_norm": 8.469663619995117,
+      "learning_rate": 4.9908814589665656e-05,
+      "loss": 0.3769,
+      "step": 3288
+    },
+    {
+      "epoch": 0.35,
+      "grad_norm": 6.261867046356201,
+      "learning_rate": 4.9086302989359904e-05,
+      "loss": 0.3841,
+      "step": 3836
+    },
+    {
+      "epoch": 0.4,
+      "grad_norm": 4.032571792602539,
+      "learning_rate": 4.8160783651410236e-05,
+      "loss": 0.3391,
+      "step": 4384
+    },
+    {
+      "epoch": 0.45,
+      "grad_norm": 48.33228302001953,
+      "learning_rate": 4.723526431346057e-05,
+      "loss": 0.3192,
+      "step": 4932
+    },
+    {
+      "epoch": 0.5,
+      "grad_norm": 4.632198810577393,
+      "learning_rate": 4.630974497551089e-05,
+      "loss": 0.3239,
+      "step": 5480
+    },
+    {
+      "epoch": 0.55,
+      "grad_norm": 2.5730295181274414,
+      "learning_rate": 4.5384225637561225e-05,
+      "loss": 0.3143,
+      "step": 6028
+    },
+    {
+      "epoch": 0.6,
+      "grad_norm": 3.378683090209961,
+      "learning_rate": 4.446208410741429e-05,
+      "loss": 0.3059,
+      "step": 6576
+    },
+    {
+      "epoch": 0.65,
+      "grad_norm": 10.585208892822266,
+      "learning_rate": 4.353656476946462e-05,
+      "loss": 0.2987,
+      "step": 7124
+    },
+    {
+      "epoch": 0.7,
+      "grad_norm": 16.021188735961914,
+      "learning_rate": 4.261104543151495e-05,
+      "loss": 0.2935,
+      "step": 7672
+    },
+    {
+      "epoch": 0.75,
+      "grad_norm": 2.585524797439575,
+      "learning_rate": 4.168552609356528e-05,
+      "loss": 0.292,
+      "step": 8220
+    },
+    {
+      "epoch": 0.8,
+      "grad_norm": 0.8300177454948425,
+      "learning_rate": 4.0761695659516976e-05,
+      "loss": 0.2746,
+      "step": 8768
+    },
+    {
+      "epoch": 0.85,
+      "grad_norm": 1.8167496919631958,
+      "learning_rate": 3.9837865225468676e-05,
+      "loss": 0.288,
+      "step": 9316
+    },
+    {
+      "epoch": 0.9,
+      "grad_norm": 14.431105613708496,
+      "learning_rate": 3.8912345887519e-05,
+      "loss": 0.3442,
+      "step": 9864
+    },
+    {
+      "epoch": 0.95,
+      "grad_norm": 4.341527462005615,
+      "learning_rate": 3.798682654956933e-05,
+      "loss": 0.2964,
+      "step": 10412
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 0.9708638191223145,
+      "learning_rate": 3.706130721161966e-05,
+      "loss": 0.2836,
+      "step": 10960
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9091862559565882,
+      "eval_auc": 0.9327717478336053,
+      "eval_f1": 0.9394671651544857,
+      "eval_loss": 0.26499995589256287,
+      "eval_precision": 0.9356703902158447,
+      "eval_recall": 0.9432948788378197,
+      "eval_runtime": 90.2174,
+      "eval_samples_per_second": 486.148,
+      "eval_steps_per_second": 15.197,
+      "step": 10965
+    },
+    {
+      "epoch": 1.05,
+      "grad_norm": 10.155410766601562,
+      "learning_rate": 3.613578787366999e-05,
+      "loss": 0.2915,
+      "step": 11508
+    },
+    {
+      "epoch": 1.1,
+      "grad_norm": 13.481185913085938,
+      "learning_rate": 3.521026853572032e-05,
+      "loss": 0.2706,
+      "step": 12056
+    },
+    {
+      "epoch": 1.15,
+      "grad_norm": 11.898757934570312,
+      "learning_rate": 3.428474919777065e-05,
+      "loss": 0.2577,
+      "step": 12604
+    },
+    {
+      "epoch": 1.2,
+      "grad_norm": 102.29252624511719,
+      "learning_rate": 3.336091876372234e-05,
+      "loss": 0.2867,
+      "step": 13152
+    },
+    {
+      "epoch": 1.25,
+      "grad_norm": 0.8772763609886169,
+      "learning_rate": 3.243539942577267e-05,
+      "loss": 0.2543,
+      "step": 13700
+    },
+    {
+      "epoch": 1.3,
+      "grad_norm": 3.079983711242676,
+      "learning_rate": 3.1509880087823005e-05,
+      "loss": 0.2747,
+      "step": 14248
+    },
+    {
+      "epoch": 1.35,
+      "grad_norm": 2.654982805252075,
+      "learning_rate": 3.058436074987334e-05,
+      "loss": 0.2637,
+      "step": 14796
+    },
+    {
+      "epoch": 1.4,
+      "grad_norm": 8.28964900970459,
+      "learning_rate": 2.9658841411923666e-05,
+      "loss": 0.2433,
+      "step": 15344
+    },
+    {
+      "epoch": 1.45,
+      "grad_norm": 0.606247067451477,
+      "learning_rate": 2.873669988177673e-05,
+      "loss": 0.2496,
+      "step": 15892
+    },
+    {
+      "epoch": 1.5,
+      "grad_norm": 4.818925857543945,
+      "learning_rate": 2.781118054382706e-05,
+      "loss": 0.2344,
+      "step": 16440
+    },
+    {
+      "epoch": 1.55,
+      "grad_norm": 9.206971168518066,
+      "learning_rate": 2.6885661205877388e-05,
+      "loss": 0.224,
+      "step": 16988
+    },
+    {
+      "epoch": 1.6,
+      "grad_norm": 1.9517682790756226,
+      "learning_rate": 2.5960141867927716e-05,
+      "loss": 0.2115,
+      "step": 17536
+    },
+    {
+      "epoch": 1.65,
+      "grad_norm": 10.609549522399902,
+      "learning_rate": 2.503462252997805e-05,
+      "loss": 0.2102,
+      "step": 18084
+    },
+    {
+      "epoch": 1.7,
+      "grad_norm": 20.039274215698242,
+      "learning_rate": 2.4109103192028377e-05,
+      "loss": 0.2027,
+      "step": 18632
+    },
+    {
+      "epoch": 1.75,
+      "grad_norm": 2.285228729248047,
+      "learning_rate": 2.3183583854078706e-05,
+      "loss": 0.1995,
+      "step": 19180
+    },
+    {
+      "epoch": 1.8,
+      "grad_norm": 9.45280647277832,
+      "learning_rate": 2.2258064516129034e-05,
+      "loss": 0.2076,
+      "step": 19728
+    },
+    {
+      "epoch": 1.85,
+      "grad_norm": 8.692055702209473,
+      "learning_rate": 2.1332545178179363e-05,
+      "loss": 0.2075,
+      "step": 20276
+    },
+    {
+      "epoch": 1.9,
+      "grad_norm": 8.51143741607666,
+      "learning_rate": 2.040871474413106e-05,
+      "loss": 0.2097,
+      "step": 20824
+    },
+    {
+      "epoch": 1.95,
+      "grad_norm": 4.226066589355469,
+      "learning_rate": 1.948319540618139e-05,
+      "loss": 0.2153,
+      "step": 21372
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 3.73645281791687,
+      "learning_rate": 1.855767606823172e-05,
+      "loss": 0.2082,
+      "step": 21920
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9314621856403474,
+      "eval_auc": 0.96886043230506,
+      "eval_f1": 0.953925385487876,
+      "eval_loss": 0.2151412069797516,
+      "eval_precision": 0.9581845054809706,
+      "eval_recall": 0.9497039614234267,
+      "eval_runtime": 90.5052,
+      "eval_samples_per_second": 484.602,
+      "eval_steps_per_second": 15.148,
+      "step": 21930
+    },
+    {
+      "epoch": 2.05,
+      "grad_norm": 2.4432873725891113,
+      "learning_rate": 1.763215673028205e-05,
+      "loss": 0.1786,
+      "step": 22468
+    },
+    {
+      "epoch": 2.1,
+      "grad_norm": 0.6836100816726685,
+      "learning_rate": 1.6708326296233746e-05,
+      "loss": 0.1842,
+      "step": 23016
+    },
+    {
+      "epoch": 2.15,
+      "grad_norm": 2.6022326946258545,
+      "learning_rate": 1.5784495862185442e-05,
+      "loss": 0.1801,
+      "step": 23564
+    },
+    {
+      "epoch": 2.2,
+      "grad_norm": 1.9158451557159424,
+      "learning_rate": 1.4858976524235771e-05,
+      "loss": 0.1731,
+      "step": 24112
+    },
+    {
+      "epoch": 2.25,
+      "grad_norm": 7.503026485443115,
+      "learning_rate": 1.39334571862861e-05,
+      "loss": 0.1726,
+      "step": 24660
+    },
+    {
+      "epoch": 2.3,
+      "grad_norm": 3.1770987510681152,
+      "learning_rate": 1.300793784833643e-05,
+      "loss": 0.1771,
+      "step": 25208
+    },
+    {
+      "epoch": 2.35,
+      "grad_norm": 4.539430141448975,
+      "learning_rate": 1.208241851038676e-05,
+      "loss": 0.1551,
+      "step": 25756
+    },
+    {
+      "epoch": 2.4,
+      "grad_norm": 1.772599458694458,
+      "learning_rate": 1.1156899172437089e-05,
+      "loss": 0.1735,
+      "step": 26304
+    },
+    {
+      "epoch": 2.45,
+      "grad_norm": 3.809593439102173,
+      "learning_rate": 1.023137983448742e-05,
+      "loss": 0.1683,
+      "step": 26852
+    },
+    {
+      "epoch": 2.5,
+      "grad_norm": 10.1038179397583,
+      "learning_rate": 9.307549400439116e-06,
+      "loss": 0.1617,
+      "step": 27400
+    },
+    {
+      "epoch": 2.55,
+      "grad_norm": 18.696857452392578,
+      "learning_rate": 8.382030062489445e-06,
+      "loss": 0.1589,
+      "step": 27948
+    },
+    {
+      "epoch": 2.6,
+      "grad_norm": 15.82597827911377,
+      "learning_rate": 7.4565107245397735e-06,
+      "loss": 0.1636,
+      "step": 28496
+    },
+    {
+      "epoch": 2.65,
+      "grad_norm": 1.0566959381103516,
+      "learning_rate": 6.530991386590103e-06,
+      "loss": 0.1553,
+      "step": 29044
+    },
+    {
+      "epoch": 2.7,
+      "grad_norm": 13.043928146362305,
+      "learning_rate": 5.6054720486404325e-06,
+      "loss": 0.1532,
+      "step": 29592
+    },
+    {
+      "epoch": 2.75,
+      "grad_norm": 19.499807357788086,
+      "learning_rate": 4.679952710690762e-06,
+      "loss": 0.1426,
+      "step": 30140
+    },
+    {
+      "epoch": 2.8,
+      "grad_norm": 24.73866081237793,
+      "learning_rate": 3.756122276642459e-06,
+      "loss": 0.1514,
+      "step": 30688
+    },
+    {
+      "epoch": 2.85,
+      "grad_norm": 6.256073474884033,
+      "learning_rate": 2.8306029386927886e-06,
+      "loss": 0.1554,
+      "step": 31236
+    },
+    {
+      "epoch": 2.9,
+      "grad_norm": 0.34589943289756775,
+      "learning_rate": 1.9050836007431179e-06,
+      "loss": 0.1459,
+      "step": 31784
+    },
+    {
+      "epoch": 2.95,
+      "grad_norm": 2.303668737411499,
+      "learning_rate": 9.795642627934472e-07,
+      "loss": 0.1584,
+      "step": 32332
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 4.459900379180908,
+      "learning_rate": 5.404492484377639e-08,
+      "loss": 0.152,
+      "step": 32880
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.945028386420119,
+      "eval_auc": 0.9812675754686511,
+      "eval_f1": 0.9633213150168105,
+      "eval_loss": 0.1894965022802353,
+      "eval_precision": 0.9603846270512937,
+      "eval_recall": 0.9662760178233535,
+      "eval_runtime": 90.4032,
+      "eval_samples_per_second": 485.149,
+      "eval_steps_per_second": 15.165,
+      "step": 32895
+    }
+  ],
+  "logging_steps": 548,
+  "max_steps": 32895,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "total_flos": 3.46191659978112e+16,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-32895/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f003cc9821b5418306dca505da3f110a29d95a2ba42f015b362147654a64df6c
+size 4920

config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "cardiffnlp/twitter-roberta-base-irony",
+  "_num_labels": 2,
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "objective",
+    "1": "subjective"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "objective": 0,
+    "subjective": 1
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b8f49a8ffc04c3b84a4598c60063878faf5b7e8095ad4c640b00fd111bb5e7e8
+size 498612824

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "add_prefix_space": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f003cc9821b5418306dca505da3f110a29d95a2ba42f015b362147654a64df6c
+size 4920

training_params.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+    "data_path": "autotrain-8s6z2-1g2hg/autotrain-data",
+    "model": "cardiffnlp/twitter-roberta-base-irony",
+    "lr": 5e-05,
+    "epochs": 3,
+    "max_seq_length": 128,
+    "batch_size": 16,
+    "warmup_ratio": 0.1,
+    "gradient_accumulation": 1,
+    "optimizer": "adamw_torch",
+    "scheduler": "linear",
+    "weight_decay": 0.0,
+    "max_grad_norm": 1.0,
+    "seed": 42,
+    "train_split": "train",
+    "valid_split": "validation",
+    "text_column": "autotrain_text",
+    "target_column": "autotrain_label",
+    "logging_steps": -1,
+    "project_name": "autotrain-8s6z2-1g2hg",
+    "auto_find_batch_size": false,
+    "mixed_precision": "fp16",
+    "save_total_limit": 1,
+    "save_strategy": "epoch",
+    "push_to_hub": true,
+    "repo_id": "Re0x10/autotrain-8s6z2-1g2hg",
+    "evaluation_strategy": "epoch",
+    "username": "Re0x10",
+    "log": "none"
+}

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff