flemingxu
commited on
Commit
•
d0f36f4
1
Parent(s):
22b45db
update md
Browse files
README.md
CHANGED
@@ -1,40 +1,42 @@
|
|
1 |
---
|
2 |
-
title: chinese-alpaca-plus-
|
3 |
emoji: 📚
|
4 |
colorFrom: gray
|
5 |
colorTo: red
|
6 |
-
language:
|
7 |
- zh
|
8 |
tags:
|
9 |
- chatglm
|
10 |
- pytorch
|
11 |
- zh
|
12 |
- Text2Text-Generation
|
13 |
-
|
|
|
14 |
widget:
|
15 |
-
- text:
|
16 |
---
|
17 |
|
18 |
-
# Chinese Alpaca Plus
|
19 |
|
20 |
-
**发布中文LLaMA, Alpaca
|
21 |
|
|
|
22 |
|
23 |
-
|
|
|
|
|
|
|
|
|
24 |
|
25 |
-
-
|
26 |
-
-
|
27 |
-
- 评测结果显示,Alpaca-Plus-7B相比基础版Alpaca-7B效果更优,部分任务接近或超过13B版本
|
28 |
-
- 这一轮比拼:7B获得65.3分,13B获得70.9分,Plus-7B效果75.3分,具体评测结果请参考[效果评测](https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/examples/README.md)
|
29 |
-
|
30 |
-
本模型是`原生LLaMA-7B`合并`中文LLaMA LoRA`和`中文Alpaca LoRA`后的模型权重,可以直接使用或者继续训练。
|
31 |
|
32 |
|
33 |
test case:
|
34 |
|
35 |
|input_text|predict|
|
36 |
|:-- |:--- |
|
37 |
-
|
38 |
|
39 |
|
40 |
## Usage
|
@@ -48,7 +50,7 @@ pip install -U textgen
|
|
48 |
|
49 |
```python
|
50 |
from textgen import LlamaModel
|
51 |
-
model = LlamaModel("llama", "shibing624/chinese-alpaca-plus-
|
52 |
r = model.predict(["用一句话描述地球为什么是独一无二的。"])
|
53 |
print(r) # ['地球是独一无二的,因为它拥有独特的大气层、水循环、生物多样性以及其他自然资源,这些都使它成为一个独特的生命支持系统。']
|
54 |
```
|
@@ -78,8 +80,8 @@ def generate_prompt(text):
|
|
78 |
### Response:"""
|
79 |
|
80 |
|
81 |
-
tokenizer = LlamaTokenizer.from_pretrained('shibing624/chinese-alpaca-plus-
|
82 |
-
model = LlamaForCausalLM.from_pretrained('shibing624/chinese-alpaca-plus-
|
83 |
model.eval()
|
84 |
|
85 |
text = '为什么天空是蓝色的?'
|
@@ -104,31 +106,34 @@ print(output.replace(text, '').strip())
|
|
104 |
output:
|
105 |
```shell
|
106 |
为什么天空是蓝色的?
|
107 |
-
|
108 |
```
|
109 |
|
110 |
## 模型来源
|
111 |
|
112 |
-
基于 [多LoRA权重合并(适用于Chinese-Alpaca-Plus )](https://github.com/ymcui/Chinese-LLaMA-Alpaca/wiki/%E6%89%8B%E5%8A%A8%E6%A8%A1%E5%9E%8B%E5%90%88%E5%B9%B6%E4%B8%8E%E8%BD%AC%E6%8D%A2#%E5%A4%9Alora%E6%9D%83%E9%87%8D%E5%90%88%E5%B9%B6%E9%80%82%E7%94%A8%E4%BA%8Echinese-alpaca-plus
|
|
|
113 |
|
114 |
-
release
|
115 |
|
116 |
|
117 |
模型文件组成:
|
118 |
```
|
119 |
-
chinese-alpaca-plus-
|
120 |
-
|
121 |
-
|
122 |
-
|
123 |
-
|
124 |
-
|
125 |
-
|
126 |
-
|
127 |
-
|
128 |
-
|
|
|
|
|
129 |
```
|
130 |
|
131 |
-
硬件要求:
|
132 |
|
133 |
### 训练数据集
|
134 |
|
@@ -156,3 +161,4 @@ chinese-alpaca-plus-7b-hf
|
|
156 |
|
157 |
## Reference
|
158 |
- https://github.com/ymcui/Chinese-LLaMA-Alpaca
|
|
|
|
1 |
---
|
2 |
+
title: chinese-alpaca-plus-13b-hf
|
3 |
emoji: 📚
|
4 |
colorFrom: gray
|
5 |
colorTo: red
|
6 |
+
language:
|
7 |
- zh
|
8 |
tags:
|
9 |
- chatglm
|
10 |
- pytorch
|
11 |
- zh
|
12 |
- Text2Text-Generation
|
13 |
+
- LLaMA
|
14 |
+
license: other
|
15 |
widget:
|
16 |
+
- text: 为什么天空是蓝色的?
|
17 |
---
|
18 |
|
19 |
+
# Chinese Alpaca Plus 13B Model
|
20 |
|
21 |
+
**发布中文LLaMA-Plus, Alpaca-Plus 13B版本模型**
|
22 |
|
23 |
+
发布中文LLaMA-Plus, Alpaca-Plus 13B版本,改进点如下:
|
24 |
|
25 |
+
- 相比基础版进一步扩充了训练数据,其中LLaMA扩充至120G文本,Alpaca扩充至4.3M指令数据,重点增加了科学领域数据,涵盖:物理、化学、生物、医学、地球科学等
|
26 |
+
- Alpaca训练时采用了更大的rank,相比基础版具有更低的验证集损失
|
27 |
+
- Alpaca评测结果:13B获得74.3分,Plus-7B获得78.2分,Plus-13B获得80.8分,具体评测结果请参考[效果评测](https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/examples)
|
28 |
+
- 多轮回复长度相比旧模型提升明显(可适当增大温度系数)
|
29 |
+
- 知识问答、写作、翻译等方面效果显著提升
|
30 |
|
31 |
+
本模型是 [decapoda-research/llama-13b-hf](https://huggingface.co/decapoda-research/llama-13b-hf)
|
32 |
+
底座模型 合并 [ziqingyang/chinese-llama-plus-lora-13b](https://huggingface.co/ziqingyang/chinese-llama-plus-lora-13b) 和 [ziqingyang/chinese-alpaca-plus-lora-13b](https://huggingface.co/ziqingyang/chinese-alpaca-plus-lora-13b) 两个LoRA权重,并转化为HuggingFace版本权重(.bin文件),可以直接使用或者继续训练。
|
|
|
|
|
|
|
|
|
33 |
|
34 |
|
35 |
test case:
|
36 |
|
37 |
|input_text|predict|
|
38 |
|:-- |:--- |
|
39 |
+
|为什么天空是蓝色的?|天空是蓝色的是因为大气中的气体分子散射了太阳光中的短波长蓝光,使得我们看到的天空呈现出蓝色。|
|
40 |
|
41 |
|
42 |
## Usage
|
|
|
50 |
|
51 |
```python
|
52 |
from textgen import LlamaModel
|
53 |
+
model = LlamaModel("llama", "shibing624/chinese-alpaca-plus-13b-hf")
|
54 |
r = model.predict(["用一句话描述地球为什么是独一无二的。"])
|
55 |
print(r) # ['地球是独一无二的,因为它拥有独特的大气层、水循环、生物多样性以及其他自然资源,这些都使它成为一个独特的生命支持系统。']
|
56 |
```
|
|
|
80 |
### Response:"""
|
81 |
|
82 |
|
83 |
+
tokenizer = LlamaTokenizer.from_pretrained('shibing624/chinese-alpaca-plus-13b-hf')
|
84 |
+
model = LlamaForCausalLM.from_pretrained('shibing624/chinese-alpaca-plus-13b-hf').half().cuda()
|
85 |
model.eval()
|
86 |
|
87 |
text = '为什么天空是蓝色的?'
|
|
|
106 |
output:
|
107 |
```shell
|
108 |
为什么天空是蓝色的?
|
109 |
+
天空是蓝色的是因为大气中的气体分子散射了太阳光中的短波长蓝光,使得我们看到的天空呈现出蓝色。
|
110 |
```
|
111 |
|
112 |
## 模型来源
|
113 |
|
114 |
+
基于 [多LoRA权重合并(适用于Chinese-Alpaca-Plus )](https://github.com/ymcui/Chinese-LLaMA-Alpaca/wiki/%E6%89%8B%E5%8A%A8%E6%A8%A1%E5%9E%8B%E5%90%88%E5%B9%B6%E4%B8%8E%E8%BD%AC%E6%8D%A2#%E5%A4%9Alora%E6%9D%83%E9%87%8D%E5%90%88%E5%B9%B6%E9%80%82%E7%94%A8%E4%BA%8Echinese-alpaca-plus)方法手动合并而成,具体是使用 [decapoda-research/llama-13b-hf](https://huggingface.co/decapoda-research/llama-13b-hf)
|
115 |
+
底座模型 合并 [ziqingyang/chinese-llama-plus-lora-13b](https://huggingface.co/ziqingyang/chinese-llama-plus-lora-13b) 和 [ziqingyang/chinese-alpaca-plus-lora-13b](https://huggingface.co/ziqingyang/chinese-alpaca-plus-lora-13b) 两个LoRA权重 得到,并转化为HuggingFace版本权重(.bin文件)。
|
116 |
|
117 |
+
release合并后的模型权重,一步到位直接使用,省电、减少碳排放。
|
118 |
|
119 |
|
120 |
模型文件组成:
|
121 |
```
|
122 |
+
chinese-alpaca-plus-13b-hf
|
123 |
+
|-- config.json
|
124 |
+
|-- generation_config.json
|
125 |
+
|-- LICENSE
|
126 |
+
|-- pytorch_model-00001-of-00003.bin
|
127 |
+
|-- pytorch_model-00002-of-00003.bin
|
128 |
+
|-- pytorch_model-00003-of-00003.bin
|
129 |
+
|-- pytorch_model.bin.index.json
|
130 |
+
|-- README.md
|
131 |
+
|-- special_tokens_map.json
|
132 |
+
|-- tokenizer_config.json
|
133 |
+
`-- tokenizer.model
|
134 |
```
|
135 |
|
136 |
+
硬件要求:25G显存
|
137 |
|
138 |
### 训练数据集
|
139 |
|
|
|
161 |
|
162 |
## Reference
|
163 |
- https://github.com/ymcui/Chinese-LLaMA-Alpaca
|
164 |
+
|