tharindu commited on Mar 18, 2024

Commit

78ece11

verified ·

1 Parent(s): b91afc1

Upload folder using huggingface_hub

Browse files

Files changed (29) hide show

best_model/config.json +40 -0
best_model/eval_results.txt +4 -0
best_model/model.safetensors +3 -0
best_model/model_args.json +1 -0
best_model/optimizer.pt +3 -0
best_model/scheduler.pt +3 -0
best_model/sentencepiece.bpe.model +3 -0
best_model/special_tokens_map.json +15 -0
best_model/tokenizer_config.json +56 -0
best_model/training_args.bin +3 -0
checkpoint-8725-epoch-5/config.json +40 -0
checkpoint-8725-epoch-5/eval_results.txt +4 -0
checkpoint-8725-epoch-5/model.safetensors +3 -0
checkpoint-8725-epoch-5/model_args.json +1 -0
checkpoint-8725-epoch-5/optimizer.pt +3 -0
checkpoint-8725-epoch-5/scheduler.pt +3 -0
checkpoint-8725-epoch-5/sentencepiece.bpe.model +3 -0
checkpoint-8725-epoch-5/special_tokens_map.json +15 -0
checkpoint-8725-epoch-5/tokenizer_config.json +56 -0
checkpoint-8725-epoch-5/training_args.bin +3 -0
config.json +40 -0
eval_results.txt +4 -0
model.safetensors +3 -0
model_args.json +1 -0
sentencepiece.bpe.model +3 -0
special_tokens_map.json +15 -0
tokenizer_config.json +56 -0
training_args.bin +3 -0
training_progress_scores.csv +20 -0

best_model/config.json ADDED Viewed

	@@ -0,0 +1,40 @@

+{
+  "_name_or_path": "FacebookAI/xlm-roberta-large",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2,
+    "LABEL_3": 3
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

best_model/eval_results.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+eval_loss = 0.22416480308033757
+macro_f1 = 0.93463864322801
+mcc = 0.9155065149177393
+weighted_f1 = 0.934599002233577

best_model/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:791e6199ae37f9e90b8f90a5c1fdd11c72829e0d3d88cc51bc257b215a04ea27
+size 2243825472

best_model/model_args.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"adam_epsilon": 1e-08, "best_model_dir": "outputs/xlm-roberta-large/best_model", "cache_dir": "cache_dir/xlm-roberta-large", "config": {}, "cosine_schedule_num_cycles": 0.5, "custom_layer_parameters": [], "custom_parameter_groups": [], "dataloader_num_workers": 0, "do_lower_case": false, "dynamic_quantize": false, "early_stopping_consider_epochs": false, "early_stopping_delta": 0, "early_stopping_metric": "eval_loss", "early_stopping_metric_minimize": true, "early_stopping_patience": 3, "encoding": null, "adafactor_eps": [1e-30, 0.001], "adafactor_clip_threshold": 1.0, "adafactor_decay_rate": -0.8, "adafactor_beta1": null, "adafactor_scale_parameter": true, "adafactor_relative_step": true, "adafactor_warmup_init": true, "eval_batch_size": 16, "evaluate_during_training": true, "evaluate_during_training_silent": true, "evaluate_during_training_steps": 600, "evaluate_during_training_verbose": true, "evaluate_each_epoch": true, "fp16": true, "gradient_accumulation_steps": 1, "learning_rate": 2e-05, "local_rank": -1, "logging_steps": 600, "manual_seed": 777, "max_grad_norm": 1.0, "max_seq_length": 256, "model_name": "FacebookAI/xlm-roberta-large", "model_type": "xlmroberta", "multiprocessing_chunksize": 500, "n_gpu": 1, "no_cache": false, "no_save": false, "not_saved_args": [], "num_train_epochs": 5, "optimizer": "AdamW", "output_dir": "outputs/xlm-roberta-large", "overwrite_output_dir": true, "process_count": 78, "polynomial_decay_schedule_lr_end": 1e-07, "polynomial_decay_schedule_power": 1.0, "quantized_model": false, "reprocess_input_data": true, "save_best_model": true, "save_eval_checkpoints": true, "save_model_every_epoch": true, "save_optimizer_and_scheduler": true, "save_recent_only": true, "save_steps": 600, "scheduler": "linear_schedule_with_warmup", "silent": false, "skip_special_tokens": true, "tensorboard_dir": null, "thread_count": null, "train_batch_size": 16, "train_custom_parameters_only": false, "use_cached_eval_features": false, "use_early_stopping": false, "use_multiprocessing": false, "wandb_kwargs": {}, "wandb_project": "NSINa_category_prediction", "warmup_ratio": 0.06, "warmup_steps": 524, "weight_decay": 0.0, "model_class": "LCPModel", "labels_list": [0, 1, 2, 3], "labels_map": {}, "lazy_delimiter": "\t", "lazy_labels_column": 1, "lazy_loading": false, "lazy_loading_start_line": 1, "lazy_text_a_column": null, "lazy_text_b_column": null, "lazy_text_column": 0, "onnx": false, "regression": false, "sliding_window": false, "special_tokens_list": [], "stride": 0.8, "tie_value": 1}

best_model/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd8b3a592edc02ddcef2b73c096e2a8e1732b812cdeea554c412711763a4259a
+size 4479388090

best_model/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1849ef9dccf2273bd0d99eee5a2105e3a48df76b7f67065ab0acfa8eeadf2891
+size 1064

best_model/sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
+size 5069051

best_model/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

best_model/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

best_model/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:58d8b6c552f7519b305428741637e862116f7f55022a8ec2994716db71a91816
+size 3576

checkpoint-8725-epoch-5/config.json ADDED Viewed

	@@ -0,0 +1,40 @@

+{
+  "_name_or_path": "FacebookAI/xlm-roberta-large",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2,
+    "LABEL_3": 3
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

checkpoint-8725-epoch-5/eval_results.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+eval_loss = 0.3527397541809328
+macro_f1 = 0.9444199082055502
+mcc = 0.9267078234581015
+weighted_f1 = 0.9444960504880588

checkpoint-8725-epoch-5/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:22687127bca789b992c22ea84d2383e20d5658da45ebdf0c35458a8e80973f8a
+size 2243825472

checkpoint-8725-epoch-5/model_args.json ADDED Viewed

	@@ -0,0 +1 @@

checkpoint-8725-epoch-5/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4026374a611127cb9ee4efcd21d9591c86fcf6217ef35f6fb6c65f94f17e7c85
+size 4479388090

checkpoint-8725-epoch-5/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:faf3b20aae09053b469f456c0a1ae63775158cccfb279532733245f8dd12b35b
+size 1064

checkpoint-8725-epoch-5/sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
+size 5069051

checkpoint-8725-epoch-5/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

checkpoint-8725-epoch-5/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

checkpoint-8725-epoch-5/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:58d8b6c552f7519b305428741637e862116f7f55022a8ec2994716db71a91816
+size 3576

config.json ADDED Viewed

	@@ -0,0 +1,40 @@

+{
+  "_name_or_path": "FacebookAI/xlm-roberta-large",
+  "architectures": [
+    "XLMRobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2,
+    "LABEL_3": 3
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

eval_results.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+eval_loss = 0.3527397541809328
+macro_f1 = 0.9444199082055502
+mcc = 0.9267078234581015
+weighted_f1 = 0.9444960504880588

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:22687127bca789b992c22ea84d2383e20d5658da45ebdf0c35458a8e80973f8a
+size 2243825472

model_args.json ADDED Viewed

	@@ -0,0 +1 @@

sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
+size 5069051

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "250001": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:58d8b6c552f7519b305428741637e862116f7f55022a8ec2994716db71a91816
+size 3576

training_progress_scores.csv ADDED Viewed

	@@ -0,0 +1,20 @@

+global_step,mcc,train_loss,eval_loss,macro_f1,weighted_f1
+600,0.8613714523315082,0.029041647911071777,0.4146597638879855,0.8950014686768406,0.8950306752641398
+1200,0.8951684202971599,0.04009270668029785,0.28005093820009036,0.9186672259080284,0.9188712301636164
+1745,0.9070939961826601,0.5069212317466736,0.24941914404752022,0.9294801244500898,0.9296167814688095
+1800,0.901369533859597,0.07611238956451416,0.26668646633048954,0.9243578553025914,0.9249611621380743
+2400,0.9120112286481514,0.4786972999572754,0.2511887704742323,0.9324075960193206,0.9324307542354651
+3000,0.9155065149177393,0.04343593120574951,0.22416480308033757,0.93463864322801,0.934599002233577
+3490,0.917515289861158,0.02504712902009487,0.23598663609705328,0.9371638827774854,0.9371914886600456
+3600,0.9155201969768547,0.004887402057647705,0.2653474329452309,0.9358329327369176,0.9360119441683179
+4200,0.914081310582887,0.004178345203399658,0.28432267102096037,0.9350870243470365,0.9351258821128035
+4800,0.9181652885908079,0.015842676162719727,0.2286472171304997,0.9375197884013722,0.9375772555746051
+5235,0.9111658116819547,0.14136971533298492,0.2758317851250242,0.9323954286869865,0.9326629415037179
+5400,0.9235981445016428,0.0021919459104537964,0.28313379161439106,0.9417027946613656,0.9416956693932137
+6000,0.9207627129511015,0.22244414687156677,0.3001117281370902,0.939539536730249,0.9395232890690287
+6600,0.9244311780546717,0.0017820075154304504,0.283447847214345,0.9422728504702124,0.9424141544649244
+6980,0.9191727538549547,0.3308008909225464,0.2911242759935366,0.9388504379547894,0.9391085949152542
+7200,0.9255916387184592,0.0024506524205207825,0.3134805263841006,0.9434668105112398,0.9434587547273992
+7800,0.921801693199289,0.005529776215553284,0.3448292458365124,0.9408245158305933,0.9409869393098398
+8400,0.9258661593025348,0.1435117870569229,0.3544449618358655,0.9437758892717953,0.9438386040232837
+8725,0.9267078234581015,0.39804455637931824,0.3527397541809328,0.9444199082055502,0.9444960504880588