quincyqiang commited on
Commit
2d55058
1 Parent(s): eea471d

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +0 -50
README.md CHANGED
@@ -19,55 +19,6 @@ language:
19
  - 🚀多样性指令数据
20
  - 🚀筛选高质量中文数据
21
 
22
- | 模型名字 | 参数量 | 模型地址 |
23
- |------------|--------|------|
24
- | gogpt-560m | 5.6亿参数 | 🤗[golaxy/gogpt-560m](https://huggingface.co/golaxy/gogpt-560m) |
25
- | gogpt-3b | 30亿参数 | 🤗[golaxy/gogpt-3b](https://huggingface.co/golaxy/gogpt-3b) |
26
- | gogpt-7b | 70亿参数 | 🤗[golaxy/gogpt-7b](https://huggingface.co/golaxy/gogpt-7b) |
27
-
28
-
29
- ## 测试效果
30
- ![img.png](resources/test1.png)
31
- ![img.png](resources/test2.png)
32
- ![img.png](resources/test3.png)
33
- ![img.png](resources/test4.png)
34
- ![img.png](resources/test5.png)
35
- ![img.png](resources/test6.png)
36
-
37
-
38
- ## TODO
39
- - 进行RLFH训练
40
- - 后续加入中英平行语料
41
-
42
- ## 感谢
43
-
44
- - [@hz大佬-zero_nlp](https://github.com/yuanzhoulvpi2017/zero_nlp)
45
- - [stanford_alpaca](https://github.com/tatsu-lab/stanford_alpaca)
46
- - [Belle数据](https://huggingface.co/BelleGroup)
47
- (base) [searchgpt@worker2 output-bloom-7b]$ cat README.md ^C
48
- (base) [searchgpt@worker2 output-bloom-7b]$ vim README.md
49
- (base) [searchgpt@worker2 output-bloom-7b]$ cat README.md
50
- ---
51
- license: apache-2.0
52
- datasets:
53
- - BelleGroup/train_2M_CN
54
- - BelleGroup/train_3.5M_CN
55
- - BelleGroup/train_1M_CN
56
- - BelleGroup/train_0.5M_CN
57
- - BelleGroup/school_math_0.25M
58
- language:
59
- - zh
60
- ---
61
-
62
- ## GoGPT
63
-
64
- 基于中文指令数据微调BLOOM
65
- ![img.png](resources/img.png)
66
- > 训练第一轮足够了,后续第二轮和第三轮提升不大
67
-
68
- - 🚀多样性指令数据
69
- - 🚀筛选高质量中文数据
70
-
71
  | 模型名字 | 参数量 | 模型地址 |
72
  |------------|--------|------|
73
  | gogpt-560m | 5.6亿参数 | 🤗[golaxy/gogpt-560m](https://huggingface.co/golaxy/gogpt-560m) |
@@ -94,4 +45,3 @@ language:
94
  - [@hz大佬-zero_nlp](https://github.com/yuanzhoulvpi2017/zero_nlp)
95
  - [stanford_alpaca](https://github.com/tatsu-lab/stanford_alpaca)
96
  - [Belle数据](https://huggingface.co/BelleGroup)
97
-
 
19
  - 🚀多样性指令数据
20
  - 🚀筛选高质量中文数据
21
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
22
  | 模型名字 | 参数量 | 模型地址 |
23
  |------------|--------|------|
24
  | gogpt-560m | 5.6亿参数 | 🤗[golaxy/gogpt-560m](https://huggingface.co/golaxy/gogpt-560m) |
 
45
  - [@hz大佬-zero_nlp](https://github.com/yuanzhoulvpi2017/zero_nlp)
46
  - [stanford_alpaca](https://github.com/tatsu-lab/stanford_alpaca)
47
  - [Belle数据](https://huggingface.co/BelleGroup)