feat: upload model

upload model, config, tokenizer.json file
upload README.md

Files changed (13) hide show

README.md ADDED Viewed

+# 🧑🏻‍💻 KLUE RoBERTa Large
+- 이 모델은 klue/roberta-large를 한국어 Machine Reading Comprehension를 위해 KorQuAD 데이터 2.1 version 27,423개의 데이터를 학습시켜 만든 모델입니다.
+# 📝 What Should Know
+- KorQuAD 원본 데이터가 아닌 하이퍼링크, 태그, 유니코드 BOM를 제거하여 학습 하였고,
+# 📁 Getting Started
+```python
+from transformers import AutoConfig, AutoModelForQuestionAnswering
+config = AutoConfig.from_pretrained('uomnf97/klue-roberta-finetuned-korquad-v2')
+tokenizer = AutoTokenizer.from_pretrained('uomnf97/klue-roberta-finetuned-korquad-v2')
+model = AutoModelForQuestionAnswering.from_pretrained('uomnf97/klue-roberta-finetuned-korquad-v2',config=config)
+```

config.json ADDED Viewed

+{
+  "_name_or_path": "klue/roberta-large",
+  "architectures": [
+    "RobertaForQuestionAnswering"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "tokenizer_class": "BertTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.29.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 32000
+}

optimizer.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:139652037217fd89b468e138a39ce1ec8f7dff634ea8b56be7284728d42493e0
+size 2685100357

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c844a4ff6c4f87e27a8f0606f0420a566c41c1f7cc41d85b797b4fc97e41cf9
+size 1342574701

rng_state.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1e89d69cb679b8f090f7e6523f5e532965b7f34e7c227eb777923d79340c9377
+size 14575

scaler.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b36a55bcf2baff407691543bae09334561a9cc0288c7d09bc32c0597a006500a
+size 557

scheduler.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0fcebb672ab2f76eb34287532745ebb230e34a4bcb92fd708a66bc6d6579e589
+size 627

special_tokens_map.json ADDED Viewed

+{
+  "bos_token": "[CLS]",
+  "cls_token": "[CLS]",
+  "eos_token": "[SEP]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

+{
+  "bos_token": "[CLS]",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": false,
+  "eos_token": "[SEP]",
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3efbc21d48c90b5065460fe64c8f7890a1a4e3d4f7ff964998bd92bd5e84a992
+size 3963

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff