trained with chimera_qa

Browse files

Files changed (6) hide show

README.md +14 -17
config.json +1 -1
pytorch_model.bin +2 -2
tokenizer.json +0 -0
tokenizer_config.json +1 -1
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -3,24 +3,21 @@ widget:
 - text: "สวนกุหลาบเป็นโรงเรียนอะไร"
   context: "โรงเรียนสวนกุหลาบวิทยาลัย (Suankularb Wittayalai School) (อักษรย่อ : ส.ก. / S.K.) เป็นโรงเรียนชายล้วน ระดับชั้นมัธยมศึกษาขนาดใหญ่พิเศษ สังกัดสำนักงานเขตพื้นที่การศึกษามัธยมศึกษาเขต 1 สำนักงานคณะกรรมการการศึกษาขั้นพื้นฐาน (ชื่อเดิม: กรมสามัญศึกษา) กระทรวงศึกษาธิการ ก่อตั้งโดย พระบาทสมเด็จพระจุลจอมเกล้าเจ้าอยู่หัว ได้รับการสถาปนาขึ้นในวันที่ 8 มีนาคม พ.ศ. 2424 (ขณะนั้นนับวันที่ 1 เมษายน เป็นวันขึ้นปีใหม่ เมื่อนับอย่างสากลถือเป็น พ.ศ. 2425) โดยเป็นโรงเรียนรัฐบาลแห่งแรกของประเทศไทย"
 ---
-# wangchanberta-base-wiki-20210520-spm-finetune-qa
-Finetuning `wangchanberta-base-wiki-20210520-spm` with the training set of `iapp_wiki_qa_squad`, `thaiqa`, `xquad` (removed examples which have cosine similarity with validation and test examples over 0.8). Benchmarks shared on [wandb](https://wandb.ai/cstorm125/wangchanberta-qa) using validation and test sets of `iapp_wiki_qa_squad`.
-Trained with [thai2transformers](https://github.com/vistec-AI/thai2transformers/blob/dev/scripts/downstream/train_question_answering_lm_finetuning.py). Combined benchmark datasets downloadable at [vistec-ai/thai2transformers](https://github.com/vistec-AI/thai2transformers/releases/tag/qa-v0.2).
 Run with:
 ```
-export WANDB_PROJECT=wangchanberta-qa
-export MODEL_NAME=airesearchth/wangchanberta-base-wiki-20210520-news-spm
-CUDA_LAUNCH_BLOCKING=1 python train_question_answering_lm_finetuning.py \\\\
-  --model_name $MODEL_NAME \\\\
-  --revision main@ckp-50000 \\\\
-  --dataset_name iapp_thaiqa_xquad \\\\
-  --output_dir $MODEL_NAME-finetune-iapp_thaiqa_xquad-model \\\\
-  --log_dir $MODEL_NAME-finetune-iapp_thaiqa_xquad-log \\\\
-  --model_max_length 400 \\\\
-  --pad_on_right \\\\
-  --fp16
-```

 - text: "สวนกุหลาบเป็นโรงเรียนอะไร"
   context: "โรงเรียนสวนกุหลาบวิทยาลัย (Suankularb Wittayalai School) (อักษรย่อ : ส.ก. / S.K.) เป็นโรงเรียนชายล้วน ระดับชั้นมัธยมศึกษาขนาดใหญ่พิเศษ สังกัดสำนักงานเขตพื้นที่การศึกษามัธยมศึกษาเขต 1 สำนักงานคณะกรรมการการศึกษาขั้นพื้นฐาน (ชื่อเดิม: กรมสามัญศึกษา) กระทรวงศึกษาธิการ ก่อตั้งโดย พระบาทสมเด็จพระจุลจอมเกล้าเจ้าอยู่หัว ได้รับการสถาปนาขึ้นในวันที่ 8 มีนาคม พ.ศ. 2424 (ขณะนั้นนับวันที่ 1 เมษายน เป็นวันขึ้นปีใหม่ เมื่อนับอย่างสากลถือเป็น พ.ศ. 2425) โดยเป็นโรงเรียนรัฐบาลแห่งแรกของประเทศไทย"
 ---
+# wangchanberta-base-wiki-20210520-news-spm-finetune-qa
+Finetuning `airesearchth/wangchanberta-base-wiki-20210520-news-spm` with the training set of `iapp_wiki_qa_squad`, `thaiqa_squad`, and `nsc_qa` (removed examples which have cosine similarity with validation and test examples over 0.8; contexts of the latter two are trimmed to be around 300 `newmm` words). Benchmarks shared on [wandb](https://wandb.ai/cstorm125/wangchanberta-qa) using validation and test sets of `iapp_wiki_qa_squad`.
+Trained with [thai2transformers](https://github.com/vistec-AI/thai2transformers/blob/dev/scripts/downstream/train_question_answering_lm_finetuning.py).
 Run with:
 ```
+export MODEL_NAME=airesearch/wangchanberta-base-wiki-20210520-news-spm_span-mask
+CUDA_LAUNCH_BLOCKING=1 python train_question_answering_lm_finetuning.py \
+  --model_name $MODEL_NAME \
+  --dataset_name chimera_qa \
+  --output_dir $MODEL_NAME-finetune-chimera_qa-model \
+  --log_dir $MODEL_NAME-finetune-chimera_qa-log \
+  --model_max_length 400 \
+  --pad_on_right \
+  --fp16 \
+  --use_auth_token
+```

config.json CHANGED Viewed

@@ -20,7 +20,7 @@
   "num_hidden_layers": 12,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
-  "transformers_version": "4.6.0",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 25005

   "num_hidden_layers": 12,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
+  "transformers_version": "4.8.2",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 25005

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a9a401c297d4a73ec993fdae6dce57b0d417d6926e8abff2b714a48cf50ece51
-size 418711223

 version https://git-lfs.github.com/spec/v1
+oid sha256:2e1e8aca97ed3d69b438922a643b32a0ae2008324a3288cb9ae6ec8ea4e6c2ae
+size 418706097

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -1 +1 @@

- {"bos_token": "<s>", "eos_token": "</s>", "sep_token": "</s>", "cls_token": "<s>", "unk_token": "<unk>", "pad_token": "<pad>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "additional_special_tokens": ["<s>NOTUSED", "</s>NOTUSED", "▁"], "special_tokens_map_file": null, "model_max_length": 400, "name_or_path": "airesearchth/wangchanberta-base-wiki-20210520-news-spm"}

+ {"bos_token": "<s>", "eos_token": "</s>", "sep_token": "</s>", "cls_token": "<s>", "unk_token": "<unk>", "pad_token": "<pad>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "additional_special_tokens": ["<s>NOTUSED", "</s>NOTUSED", "▁"], "special_tokens_map_file": null, "model_max_length": 400, "name_or_path": "airesearchth/wangchanberta-base-wiki-20210520-news-spm", "sp_model_kwargs": {}, "tokenizer_class": "CamembertTokenizer"}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08c647ffc287eac9e2bf7858bae2c29e25c0c2c3e0268c571393bbfa9b1c3c34
-size 2607

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a59d822c6f1cafabda1b44c62c86e99a190a1fd0ef57dac6ab8534bebc65149
+size 2799