add custom question
Browse files
README.md
CHANGED
@@ -1,3 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
1 |
# wangchanberta-base-att-spm-uncased-finetune-qa
|
2 |
|
3 |
Finetuning `wangchanberta-base-att-spm-uncased` with the training set of `iapp_wiki_qa_squad` and `thaiqa` (removed examples which have cosine similarity with validation and test examples over 0.8). Benchmarks shared on [wandb](https://wandb.ai/cstorm125/wangchanberta-qa) using validation and test sets of `iapp_wiki_qa_squad`.
|
@@ -7,39 +12,39 @@ Trained with
|
|
7 |
export WANDB_PROJECT=wangchanberta-qa
|
8 |
|
9 |
export MODEL_NAME=wangchanberta-base-att-spm-uncased
|
10 |
-
python train_question_answering_lm_finetuning.py
|
11 |
-
--model_name $MODEL_NAME
|
12 |
-
--dataset_name iapp_thaiqa
|
13 |
-
--output_dir $MODEL_NAME-finetune-iapp_thaiqa-model
|
14 |
-
--log_dir $MODEL_NAME-finetune-iapp_thaiqa-log
|
15 |
-
--lowercase
|
16 |
-
--pad_on_right
|
17 |
--fp16
|
18 |
|
19 |
export MODEL_NAME=xlm-roberta-base
|
20 |
-
python train_question_answering_lm_finetuning.py
|
21 |
-
--model_name $MODEL_NAME
|
22 |
-
--dataset_name iapp_thaiqa
|
23 |
-
--output_dir $MODEL_NAME-finetune-iapp_thaiqa-model
|
24 |
-
--log_dir $MODEL_NAME-finetune-iapp_thaiqa-log
|
25 |
-
--pad_on_right
|
26 |
--fp16
|
27 |
|
28 |
export MODEL_NAME=bert-base-multilingual-cased
|
29 |
-
python train_question_answering_lm_finetuning.py
|
30 |
-
--model_name $MODEL_NAME
|
31 |
-
--dataset_name iapp_thaiqa
|
32 |
-
--output_dir $MODEL_NAME-finetune-iapp_thaiqa-model
|
33 |
-
--log_dir $MODEL_NAME-finetune-iapp_thaiqa-log
|
34 |
-
--pad_on_right
|
35 |
--fp16
|
36 |
|
37 |
export MODEL_NAME=wangchanberta-base-wiki-spm
|
38 |
-
python train_question_answering_lm_finetuning.py
|
39 |
-
--model_name $MODEL_NAME
|
40 |
-
--dataset_name iapp_thaiqa
|
41 |
-
--output_dir $MODEL_NAME-finetune-iapp_thaiqa-model
|
42 |
-
--log_dir $MODEL_NAME-finetune-iapp_thaiqa-log
|
43 |
-
--pad_on_right
|
44 |
--fp16
|
45 |
```
|
|
|
1 |
+
---
|
2 |
+
widget:
|
3 |
+
- text: "สวนกุหลาบเป็นโรงเรียนอะไร"
|
4 |
+
context: "โรงเรียนสวนกุหลาบวิทยาลัย (Suankularb Wittayalai School) (อักษรย่อ : ส.ก. / S.K.) เป็นโรงเรียนชายล้วน ระดับชั้นมัธยมศึกษาขนาดใหญ่พิเศษ สังกัดสำนักงานเขตพื้นที่การศึกษามัธยมศึกษาเขต 1 สำนักงานคณะกรรมการการศึกษาขั้นพื้นฐาน (ชื่อเดิม: กรมสามัญศึกษา) กระทรวงศึกษาธิการ ก่อตั้งโดย พระบาทสมเด็จพระจุลจอมเกล้าเจ้าอยู่หัว ได้รับการสถาปนาขึ้นในวันที่ 8 มีนาคม พ.ศ. 2424 (ขณะนั้นนับวันที่ 1 เมษายน เป็นวันขึ้นปีใหม่ เมื่อนับอย่างสากลถือเป็น พ.ศ. 2425) โดยเป็นโรงเรียนรัฐบาลแห่งแรกของประเทศไทย"
|
5 |
+
---
|
6 |
# wangchanberta-base-att-spm-uncased-finetune-qa
|
7 |
|
8 |
Finetuning `wangchanberta-base-att-spm-uncased` with the training set of `iapp_wiki_qa_squad` and `thaiqa` (removed examples which have cosine similarity with validation and test examples over 0.8). Benchmarks shared on [wandb](https://wandb.ai/cstorm125/wangchanberta-qa) using validation and test sets of `iapp_wiki_qa_squad`.
|
|
|
12 |
export WANDB_PROJECT=wangchanberta-qa
|
13 |
|
14 |
export MODEL_NAME=wangchanberta-base-att-spm-uncased
|
15 |
+
python train_question_answering_lm_finetuning.py \\\\
|
16 |
+
--model_name $MODEL_NAME \\\\
|
17 |
+
--dataset_name iapp_thaiqa \\\\
|
18 |
+
--output_dir $MODEL_NAME-finetune-iapp_thaiqa-model \\\\
|
19 |
+
--log_dir $MODEL_NAME-finetune-iapp_thaiqa-log \\\\
|
20 |
+
--lowercase \\\\
|
21 |
+
--pad_on_right \\\\
|
22 |
--fp16
|
23 |
|
24 |
export MODEL_NAME=xlm-roberta-base
|
25 |
+
python train_question_answering_lm_finetuning.py \\\\
|
26 |
+
--model_name $MODEL_NAME \\\\
|
27 |
+
--dataset_name iapp_thaiqa \\\\
|
28 |
+
--output_dir $MODEL_NAME-finetune-iapp_thaiqa-model \\\\
|
29 |
+
--log_dir $MODEL_NAME-finetune-iapp_thaiqa-log \\\\
|
30 |
+
--pad_on_right \\\\
|
31 |
--fp16
|
32 |
|
33 |
export MODEL_NAME=bert-base-multilingual-cased
|
34 |
+
python train_question_answering_lm_finetuning.py \\\\
|
35 |
+
--model_name $MODEL_NAME \\\\
|
36 |
+
--dataset_name iapp_thaiqa \\\\
|
37 |
+
--output_dir $MODEL_NAME-finetune-iapp_thaiqa-model \\\\
|
38 |
+
--log_dir $MODEL_NAME-finetune-iapp_thaiqa-log \\\\
|
39 |
+
--pad_on_right \\\\
|
40 |
--fp16
|
41 |
|
42 |
export MODEL_NAME=wangchanberta-base-wiki-spm
|
43 |
+
python train_question_answering_lm_finetuning.py \\\\
|
44 |
+
--model_name $MODEL_NAME \\\\
|
45 |
+
--dataset_name iapp_thaiqa \\\\
|
46 |
+
--output_dir $MODEL_NAME-finetune-iapp_thaiqa-model \\\\
|
47 |
+
--log_dir $MODEL_NAME-finetune-iapp_thaiqa-log \\\\
|
48 |
+
--pad_on_right \\\\
|
49 |
--fp16
|
50 |
```
|