aixsatoshi
commited on
Commit
•
7732356
1
Parent(s):
86b41fe
Update README.md
Browse files
README.md
CHANGED
@@ -79,3 +79,21 @@ Lora学習時のcontext長は4096tokenまでですが、4k token以上の出力
|
|
79 |
|
80 |
学習強度が1/3と、2/3のcheck pointも公開しました
|
81 |
こちらのほうがベースモデルの汎化性能維持できている可能性があります
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
79 |
|
80 |
学習強度が1/3と、2/3のcheck pointも公開しました
|
81 |
こちらのほうがベースモデルの汎化性能維持できている可能性があります
|
82 |
+
|
83 |
+
**learningstrength0.3**
|
84 |
+
num_fewshot: 2,2, batch_size: 1
|
85 |
+
| Task |Version| Metric | Value | |Stderr|
|
86 |
+
|----------------------|------:|-----------|------:|---|-----:|
|
87 |
+
|jsquad-1.1-0.3 | 1.1|exact_match|72.1747| | |
|
88 |
+
| | |f1 |85.3325| | |
|
89 |
+
|jcommonsenseqa-1.1-0.3| 1.1|acc | 0.7534|± |0.0129|
|
90 |
+
| | |acc_norm | 0.4111|± |0.0147|
|
91 |
+
|
92 |
+
**learningstrength0.6**
|
93 |
+
num_fewshot: 2,2, batch_size: 1
|
94 |
+
| Task |Version| Metric | Value | |Stderr|
|
95 |
+
|----------------------|------:|-----------|------:|---|-----:|
|
96 |
+
|jsquad-1.1-0.3 | 1.1|exact_match|72.3548| | |
|
97 |
+
| | |f1 |85.5144| | |
|
98 |
+
|jcommonsenseqa-1.1-0.3| 1.1|acc | 0.7480|± |0.0130|
|
99 |
+
| | |acc_norm | 0.4111|± |0.0147|
|