asahi417 commited on
Commit
1bd0e1a
1 Parent(s): 61db037

model update

Browse files
Files changed (26) hide show
  1. README.md +117 -0
  2. eval/{metric.first.answer.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.first.answer.paragraph_answer.question.lmqg_qg_koquad.default.json} +0 -0
  3. eval/{metric.first.answer.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.first.answer.paragraph_sentence.question.lmqg_qg_koquad.default.json} +0 -0
  4. eval/{metric.first.answer.sentence_answer.question.asahi417_qg_koquad.default.json → metric.first.answer.sentence_answer.question.lmqg_qg_koquad.default.json} +0 -0
  5. eval/{metric.first.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.first.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} +0 -0
  6. eval/{metric.first.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.first.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} +0 -0
  7. eval/{metric.first.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.first.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} +0 -0
  8. eval/{metric.last.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.last.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} +0 -0
  9. eval/{metric.last.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.last.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} +0 -0
  10. eval/{metric.last.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.last.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} +0 -0
  11. eval/{metric.long.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.long.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} +0 -0
  12. eval/{metric.long.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.long.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} +0 -0
  13. eval/{metric.long.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.long.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} +0 -0
  14. eval/{metric.middle.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.middle.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} +0 -0
  15. eval/{metric.middle.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.middle.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} +0 -0
  16. eval/{metric.middle.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.middle.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} +0 -0
  17. eval/{metric.short.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.short.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} +0 -0
  18. eval/{metric.short.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.short.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} +0 -0
  19. eval/{metric.short.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.short.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} +0 -0
  20. eval/{samples.test.hyp.paragraph_answer.question.asahi417_qg_koquad.default.txt → samples.test.hyp.paragraph_answer.question.lmqg_qg_koquad.default.txt} +0 -0
  21. eval/{samples.test.hyp.paragraph_sentence.question.asahi417_qg_koquad.default.txt → samples.test.hyp.paragraph_sentence.question.lmqg_qg_koquad.default.txt} +0 -0
  22. eval/{samples.test.hyp.sentence_answer.question.asahi417_qg_koquad.default.txt → samples.test.hyp.sentence_answer.question.lmqg_qg_koquad.default.txt} +0 -0
  23. eval/{samples.validation.hyp.paragraph_answer.question.asahi417_qg_koquad.default.txt → samples.validation.hyp.paragraph_answer.question.lmqg_qg_koquad.default.txt} +0 -0
  24. eval/{samples.validation.hyp.paragraph_sentence.question.asahi417_qg_koquad.default.txt → samples.validation.hyp.paragraph_sentence.question.lmqg_qg_koquad.default.txt} +0 -0
  25. eval/{samples.validation.hyp.sentence_answer.question.asahi417_qg_koquad.default.txt → samples.validation.hyp.sentence_answer.question.lmqg_qg_koquad.default.txt} +0 -0
  26. trainer_config.json +1 -1
README.md ADDED
@@ -0,0 +1,117 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ ---
3
+ license: cc-by-4.0
4
+ metrics:
5
+ - bleu4
6
+ - meteor
7
+ - rouge-l
8
+ - bertscore
9
+ - moverscore
10
+ language: ko
11
+ datasets:
12
+ - lmqg/qg_koquad
13
+ pipeline_tag: text2text-generation
14
+ tags:
15
+ - question generation
16
+ - answer extraction
17
+ widget:
18
+ - text: "generate question: 1990년 영화 《 <hl> 남부군 <hl> 》에서 단역으로 영화배우 첫 데뷔에 이어 같은 해 KBS 드라마 《지구인》에서 단역으로 출연하였고 이듬해 MBC 《여명의 눈동자》를 통해 단역으로 출연하였다."
19
+ example_title: "Question Generation Example 1"
20
+ - text: "generate question: 백신이 없기때문에 예방책은 <hl> 살충제 <hl> 를 사용하면서 서식 장소(찻찬 받침, 배수로, 고인 물의 열린 저장소, 버려진 타이어 등)의 수를 줄임으로써 매개체를 통제할 수 있다."
21
+ example_title: "Question Generation Example 2"
22
+ - text: "generate question: <hl> 원테이크 촬영 <hl> 이기 때문에 한 사람이 실수를 하면 처음부터 다시 찍어야 하는 상황이 발생한다."
23
+ example_title: "Question Generation Example 3"
24
+ - text: "또한 스피어스는 많은 새로운 여성 아티스트들에게 영향을 끼쳤는데, 대표적으로 데미 로바토, 케이티 페리, 크리스티니아 드바지, 레이디 가가, 리틀 부츠, 셀레나 고메즈 & 더씬, 픽시 로트 이 있다. 2007년 비욘세 놀스는 Total Request Live와의 인터뷰에서 '나는 브리트니를 사랑하고 팬이에요. 특히 새 앨범 Blackout을 좋아해요'라고 말했다. 린제이 로한은 '언제나 브리트니 스피어스에게 영감을 받는다. 학창시절 그녀처럼 타블로이드에 오르기를 꿈꿔왔다'고 말하며 롤 모델로 꼽았다. 스피어스는 현대 음악가들에게 음악적 영감으로 언급되기도 했다. <hl> 마일리 사이러스는 자신의 히트곡 Party in the U.S.A. 가 브리트니에게 영감과 영향을 받은 곡이라고 밝혔다. <hl> 베리 매닐로우의 앨범 15 Minutes 역시 브리트니에게 영감을 얻었다고 언급되었다."
25
+ example_title: "Answer Extraction Example 1"
26
+ - text: "지난 22일 아프리카TV는 BJ 철구가 서비스 정지 처분을 받았음을 밝혔다. 서비스 정지 처분을 사유는 철구가 10대 청소년에게 유해한 장면을 방송으로 내보냈기 때문이었다. 문제가 된 장면은 BJ 철구가 미성년자는 시청할 수 없게 하는 19세 시청 가능 설정을 하지 않은 채 흡연하는 모습을 여과 없이 드러낸 장면이다. 아프리카TV는 청소년 보호 정책의 '청소년들이 해로운 환경으로부터 보호받을 수 있도록 조치한다'라고 조항을 근거로 철구에게 서비스 정지 처분을 내렸다. 흡연 이외에 음주 방송 등도 19세 시청 가능 설정을 해야만 방송할 수 있다. <hl> 게다가 철구의 방송 정지 처분은 이번에 처음이 아니라 16번 째기 때문에 더욱더 논란이 되고 있다. <hl>"
27
+ example_title: "Answer Extraction Example 2"
28
+ model-index:
29
+ - name: lmqg/mt5-small-koquad-multitask
30
+ results:
31
+ - task:
32
+ name: Text2text Generation
33
+ type: text2text-generation
34
+ dataset:
35
+ name: lmqg/qg_koquad
36
+ type: default
37
+ args: default
38
+ metrics:
39
+ - name: BLEU4
40
+ type: bleu4
41
+ value: 0.10906053987753252
42
+ - name: ROUGE-L
43
+ type: rouge-l
44
+ value: 0.25825433157641464
45
+ - name: METEOR
46
+ type: meteor
47
+ value: 0.2752418309340361
48
+ - name: BERTScore
49
+ type: bertscore
50
+ value: 0.8339547658777764
51
+ - name: MoverScore
52
+ type: moverscore
53
+ value: 0.8253569952436216
54
+ ---
55
+
56
+ # Language Models Fine-tuning on Question Generation: `lmqg/mt5-small-koquad-multitask`
57
+ This model is fine-tuned version of [google/mt5-small](https://huggingface.co/google/mt5-small) for question generation task on the
58
+ [lmqg/qg_koquad](https://huggingface.co/datasets/lmqg/qg_koquad) (dataset_name: default).
59
+ This model is fine-tuned on the answer extraction task as well as the question generation.
60
+
61
+ ### Overview
62
+ - **Language model:** [google/mt5-small](https://huggingface.co/google/mt5-small)
63
+ - **Language:** ko
64
+ - **Training data:** [lmqg/qg_koquad](https://huggingface.co/datasets/lmqg/qg_koquad) (default)
65
+ - **Online Demo:** [https://autoqg.net/](https://autoqg.net/)
66
+ - **Repository:** [https://github.com/asahi417/lm-question-generation](https://github.com/asahi417/lm-question-generation)
67
+ - **Paper:** [TBA](TBA)
68
+
69
+ ### Usage
70
+ ```python
71
+
72
+ from transformers import pipeline
73
+
74
+ model_path = 'lmqg/mt5-small-koquad-multitask'
75
+ pipe = pipeline("text2text-generation", model_path)
76
+
77
+ # Question Generation
78
+ question = pipe('generate question: 1990년 영화 《 <hl> 남부군 <hl> 》에서 단역으로 영화배우 첫 데뷔에 이어 같은 해 KBS 드라마 《지구인》에서 단역으로 출연하였고 이듬해 MBC 《여명의 눈동자》를 통해 단역으로 출연하였다.')
79
+ # Answer Extraction
80
+ answer = pipe('extract answers: 또한 스피어스��� 많은 새로운 여성 아티스트들에게 영향을 끼쳤는데, 대표적으로 데미 로바토, 케이티 페리, 크리스티니아 드바지, 레이디 가가, 리틀 부츠, 셀레나 고메즈 & 더씬, 픽시 로트 이 있다. 2007년 비욘세 놀스는 Total Request Live와의 인터뷰에서 '나는 브리트니를 사랑하고 팬이에요. 특히 새 앨범 Blackout을 좋아해요'라고 말했다. 린제이 로한은 '언제나 브리트니 스피어스에게 영감을 받는다. 학창시절 그녀처럼 타블로이드에 오르기를 꿈꿔왔다'고 말하며 롤 모델로 꼽았다. 스피어스는 현대 음악가들에게 음악적 영감으로 언급되기도 했다. <hl> 마일리 사이러스는 자신의 히트곡 Party in the U.S.A. 가 브리트니에게 영감과 영향을 받은 곡이라고 밝혔다. <hl> 베리 매닐로우의 앨범 15 Minutes 역시 브리트니에게 영감을 얻었다고 언급되었다.')
81
+ ```
82
+
83
+ ## Evaluation Metrics
84
+
85
+
86
+ ### Metrics
87
+
88
+ | Dataset | Type | BLEU4 | ROUGE-L | METEOR | BERTScore | MoverScore | Link |
89
+ |:--------|:-----|------:|--------:|-------:|----------:|-----------:|-----:|
90
+ | [lmqg/qg_koquad](https://huggingface.co/datasets/lmqg/qg_koquad) | default | 0.10906053987753252 | 0.25825433157641464 | 0.2752418309340361 | 0.8339547658777764 | 0.8253569952436216 | [link](https://huggingface.co/lmqg/mt5-small-koquad-multitask/raw/main/eval/metric.first.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json) |
91
+
92
+
93
+
94
+
95
+ ## Training hyperparameters
96
+
97
+ The following hyperparameters were used during fine-tuning:
98
+ - dataset_path: lmqg/qg_koquad
99
+ - dataset_name: default
100
+ - input_types: ['paragraph_answer', 'paragraph_sentence']
101
+ - output_types: ['question', 'answer']
102
+ - prefix_types: ['qg', 'ae']
103
+ - model: google/mt5-small
104
+ - max_length: 512
105
+ - max_length_output: 32
106
+ - epoch: 6
107
+ - batch: 16
108
+ - lr: 0.001
109
+ - fp16: False
110
+ - random_seed: 1
111
+ - gradient_accumulation_steps: 4
112
+ - label_smoothing: 0.15
113
+
114
+ The full configuration can be found at [fine-tuning config file](https://huggingface.co/lmqg/mt5-small-koquad-multitask/raw/main/trainer_config.json).
115
+
116
+ ## Citation
117
+ TBA
eval/{metric.first.answer.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.first.answer.paragraph_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.first.answer.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.first.answer.paragraph_sentence.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.first.answer.sentence_answer.question.asahi417_qg_koquad.default.json → metric.first.answer.sentence_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.first.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.first.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.first.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.first.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.first.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.first.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.last.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.last.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.last.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.last.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.last.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.last.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.long.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.long.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.long.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.long.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.long.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.long.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.middle.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.middle.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.middle.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.middle.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.middle.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.middle.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.short.sentence.paragraph_answer.question.asahi417_qg_koquad.default.json → metric.short.sentence.paragraph_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.short.sentence.paragraph_sentence.question.asahi417_qg_koquad.default.json → metric.short.sentence.paragraph_sentence.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{metric.short.sentence.sentence_answer.question.asahi417_qg_koquad.default.json → metric.short.sentence.sentence_answer.question.lmqg_qg_koquad.default.json} RENAMED
File without changes
eval/{samples.test.hyp.paragraph_answer.question.asahi417_qg_koquad.default.txt → samples.test.hyp.paragraph_answer.question.lmqg_qg_koquad.default.txt} RENAMED
File without changes
eval/{samples.test.hyp.paragraph_sentence.question.asahi417_qg_koquad.default.txt → samples.test.hyp.paragraph_sentence.question.lmqg_qg_koquad.default.txt} RENAMED
File without changes
eval/{samples.test.hyp.sentence_answer.question.asahi417_qg_koquad.default.txt → samples.test.hyp.sentence_answer.question.lmqg_qg_koquad.default.txt} RENAMED
File without changes
eval/{samples.validation.hyp.paragraph_answer.question.asahi417_qg_koquad.default.txt → samples.validation.hyp.paragraph_answer.question.lmqg_qg_koquad.default.txt} RENAMED
File without changes
eval/{samples.validation.hyp.paragraph_sentence.question.asahi417_qg_koquad.default.txt → samples.validation.hyp.paragraph_sentence.question.lmqg_qg_koquad.default.txt} RENAMED
File without changes
eval/{samples.validation.hyp.sentence_answer.question.asahi417_qg_koquad.default.txt → samples.validation.hyp.sentence_answer.question.lmqg_qg_koquad.default.txt} RENAMED
File without changes
trainer_config.json CHANGED
@@ -1 +1 @@
1
- {"dataset_path": "asahi417/qg_koquad", "dataset_name": "default", "input_types": ["paragraph_answer", "paragraph_sentence"], "output_types": ["question", "answer"], "prefix_types": ["qg", "ae"], "model": "google/mt5-small", "max_length": 512, "max_length_output": 32, "epoch": 6, "batch": 16, "lr": 0.001, "fp16": false, "random_seed": 1, "gradient_accumulation_steps": 4, "label_smoothing": 0.15}
 
1
+ {"dataset_path": "lmqg/qg_koquad", "dataset_name": "default", "input_types": ["paragraph_answer", "paragraph_sentence"], "output_types": ["question", "answer"], "prefix_types": ["qg", "ae"], "model": "google/mt5-small", "max_length": 512, "max_length_output": 32, "epoch": 6, "batch": 16, "lr": 0.001, "fp16": false, "random_seed": 1, "gradient_accumulation_steps": 4, "label_smoothing": 0.15}