shibing624
commited on
Commit
•
5035068
1
Parent(s):
528c3b0
Update README.md
Browse files
README.md
CHANGED
@@ -1,9 +1,65 @@
|
|
1 |
---
|
2 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
---
|
4 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
The following `bitsandbytes` quantization config was used during training:
|
8 |
- load_in_8bit: False
|
9 |
- load_in_4bit: True
|
@@ -14,7 +70,180 @@ The following `bitsandbytes` quantization config was used during training:
|
|
14 |
- bnb_4bit_quant_type: nf4
|
15 |
- bnb_4bit_use_double_quant: True
|
16 |
- bnb_4bit_compute_dtype: bfloat16
|
17 |
-
### Framework versions
|
18 |
|
19 |
|
20 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
---
|
2 |
+
language:
|
3 |
+
- zh
|
4 |
+
- en
|
5 |
+
tags:
|
6 |
+
- chatglm
|
7 |
+
- pytorch
|
8 |
+
- zh
|
9 |
+
- en
|
10 |
+
- Text2Text-Generation
|
11 |
+
license: "apache-2.0"
|
12 |
+
widget:
|
13 |
+
- text: "一岁宝宝发烧能吃啥药?"
|
14 |
+
|
15 |
---
|
16 |
+
|
17 |
+
# Vicuna Baichuan-13B LoRA Model
|
18 |
+
基于Baichaun-13B-chat的Vicuna微调对话模型(LoRA)
|
19 |
+
|
20 |
+
[shibing624/vicuna-baichuan-13b-chat](https://huggingface.co/shibing624/vicuna-baichuan-13b-chat) evaluate test data:
|
21 |
+
|
22 |
+
The overall performance of model on QA **test**:
|
23 |
+
|
24 |
+
|input_text|predict|
|
25 |
+
|:-- |:--- |
|
26 |
+
|一岁宝宝发烧能吃啥药?|1岁宝宝发烧时,可以考虑以下几种药物:<br/>1. 退烧药:如布洛芬(Ibuprofen)或对乙酰氨基酚(Paracetamol)。这些药物可以帮助降低体温,缓解发烧症状。<br/>2. 抗生素:如果发烧是由细菌感染引起的,可以考虑使用抗生素。但请务必在医生的建议下使用。<br/>3. 抗病毒药物:如果发烧是由病毒感染引起的,可以考虑使用抗病毒药物。但请务必在医生的建议下使用。<br/>4. 解热镇痛药:如阿司匹林(Aspirin)或对乙酰氨基酚(Paracetamol)。这些药物可以帮助缓解发烧症状。<br/>5. 抗组胺药:如苯海拉明(Diphenhydramine)或非索非那定(Naproxen)。这些药物可以帮助缓解发烧症状。<br/>请务必在医生的建议下使用这些药物,并遵循药物说明书上的用量和用法。同时,保持宝宝充足的水分摄入,并确保宝宝有足够的休息。|
|
27 |
+
|
28 |
+
在中文开放测试集中的表现优异,继承了两方面的优势:1)微调训练的底座是 [baichuan-inc/Baichuan-13B-Chat](https://huggingface.co/baichuan-inc/Baichuan-13B-Chat) 模型,是较强的中英文底座模型,2)微调使用的是高质量10万条多语言GPT4对话数据集,微调后的模型在通用对话,包括医疗行业答复能力达到领先水平,在通用问题上的答复能力不弱于Baichuan-13B-Chat。
|
29 |
|
30 |
|
31 |
+
## Training details
|
32 |
+
|
33 |
+
training args:
|
34 |
+
|
35 |
+
```
|
36 |
+
{"per_device_train_batch_size": 2,
|
37 |
+
"per_device_eval_batch_size": 2,
|
38 |
+
"gradient_accumulation_steps": 1,
|
39 |
+
"learning_rate": 2e-05,
|
40 |
+
"num_train_epochs": 3.0,
|
41 |
+
"max_steps": -1,
|
42 |
+
"lr_scheduler_type": "linear",
|
43 |
+
"warmup_ratio": 0.0,
|
44 |
+
"warmup_steps": 50,
|
45 |
+
"save_strategy": "steps",
|
46 |
+
"save_steps": 500,
|
47 |
+
"save_total_limit": 13,
|
48 |
+
"seed": 42,
|
49 |
+
"bf16": true,
|
50 |
+
"fp16": false,
|
51 |
+
"eval_steps": 50,
|
52 |
+
"remove_unused_columns": false,
|
53 |
+
"load_best_model_at_end": true,
|
54 |
+
"metric_for_best_model": "loss",
|
55 |
+
"optim": "paged_adamw_32bit",
|
56 |
+
"report_to": ["tensorboard"],
|
57 |
+
}
|
58 |
+
```
|
59 |
+
|
60 |
+
- train loss: 1.3209
|
61 |
+
- evaluate loss: 1.4953
|
62 |
+
|
63 |
The following `bitsandbytes` quantization config was used during training:
|
64 |
- load_in_8bit: False
|
65 |
- load_in_4bit: True
|
|
|
70 |
- bnb_4bit_quant_type: nf4
|
71 |
- bnb_4bit_use_double_quant: True
|
72 |
- bnb_4bit_compute_dtype: bfloat16
|
|
|
73 |
|
74 |
|
75 |
+
|
76 |
+
## Usage
|
77 |
+
本项目开源在 github repo:
|
78 |
+
- [shibing624/textgen](https://github.com/shibing624/textgen)
|
79 |
+
- [shibing624/MedicalGPT](https://github.com/shibing624/MedicalGPT)
|
80 |
+
|
81 |
+
使用textgen库:[textgen](https://github.com/shibing624/textgen),可调用LLaMA模型:
|
82 |
+
|
83 |
+
Install package:
|
84 |
+
```shell
|
85 |
+
pip install -U textgen
|
86 |
+
```
|
87 |
+
|
88 |
+
```python
|
89 |
+
from textgen import GptModel
|
90 |
+
|
91 |
+
def generate_prompt(instruction):
|
92 |
+
return f"""Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:{instruction}\n\n### Response: """
|
93 |
+
|
94 |
+
ziya_model_dir = "" # ziya模型合并后的路径
|
95 |
+
|
96 |
+
model = GptModel("llama", ziya_model_dir, peft_name="shibing624/ziya-llama-13b-medical-lora")
|
97 |
+
predict_sentence = generate_prompt("一岁宝宝发烧能吃啥药?")
|
98 |
+
r = model.predict([predict_sentence])
|
99 |
+
print(r) # ["1、首先大多数小儿退热药中含有解热镇痛成分阿司匹林或布洛芬等,这类药品虽然副作用较少..."]
|
100 |
+
```
|
101 |
+
|
102 |
+
## Usage (HuggingFace Transformers)
|
103 |
+
Without [textgen](https://github.com/shibing624/textgen), you can use the model like this:
|
104 |
+
|
105 |
+
First, you pass your input through the transformer model, then you get the generated sentence.
|
106 |
+
|
107 |
+
Install package:
|
108 |
+
```
|
109 |
+
pip install transformers
|
110 |
+
```
|
111 |
+
|
112 |
+
```python
|
113 |
+
import sys
|
114 |
+
from peft import PeftModel
|
115 |
+
from transformers import LlamaForCausalLM, LlamaTokenizer
|
116 |
+
|
117 |
+
ziya_model_dir = "" # ziya模型合并后的路径
|
118 |
+
|
119 |
+
model = LlamaForCausalLM.from_pretrained(ziya_model_dir, device_map='auto')
|
120 |
+
tokenizer = LlamaTokenizer.from_pretrained(ziya_model_dir)
|
121 |
+
model = PeftModel.from_pretrained(model, "shibing624/ziya-llama-13b-medical-lora")
|
122 |
+
device = "cuda" if torch.cuda.is_available() else "cpu"
|
123 |
+
|
124 |
+
def generate_prompt(instruction):
|
125 |
+
return f"""Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:{instruction}\n\n### Response: """
|
126 |
+
|
127 |
+
|
128 |
+
sents = ['一岁宝宝发烧能吃啥药', "who are you?"]
|
129 |
+
for s in sents:
|
130 |
+
q = generate_prompt(s)
|
131 |
+
inputs = tokenizer(q, return_tensors="pt")
|
132 |
+
inputs = inputs.to(device=device)
|
133 |
+
|
134 |
+
generate_ids = ref_model.generate(
|
135 |
+
**inputs,
|
136 |
+
max_new_tokens=120,
|
137 |
+
do_sample=True,
|
138 |
+
top_p=0.85,
|
139 |
+
temperature=1.0,
|
140 |
+
repetition_penalty=1.0,
|
141 |
+
eos_token_id=tokenizer.eos_token_id,
|
142 |
+
bos_token_id=tokenizer.bos_token_id,
|
143 |
+
pad_token_id=tokenizer.pad_token_id,
|
144 |
+
)
|
145 |
+
|
146 |
+
output = tokenizer.batch_decode(generate_ids, skip_special_tokens=True)[0]
|
147 |
+
print(output)
|
148 |
+
print()
|
149 |
+
```
|
150 |
+
|
151 |
+
output:
|
152 |
+
```shell
|
153 |
+
一岁宝宝发烧能吃啥药
|
154 |
+
孩子的身体是很脆弱的,如果不注意保护好自己就会出现各种疾病。有些家长在看到孩子生病后都非常着急,想要立刻给他们用药治疗,但其实并没有那么简单,因为每个人对于药物的敏感度和耐受性都是不同的,所以我们需要根据具体情况来选择合适的方法进行治疗才可以达到最佳效果。1、首先大多数小儿退热药中含有解热镇痛成分阿司匹林或布洛芬等,这类药品虽然副作用较少,但也存在过量使用引起胃肠道损伤甚至消化道溃疡出血的风险;2、还有部分小儿退热药中含有扑尔敏等抗组胺药,它们本身属于处方药,应该严格按照医嘱服用,切勿擅自加减剂量或者延长用药时间;3、此外,某些小儿退热药中含有维生素C及葡萄糖酸钙等营养补充剂,只有当患儿伴随脱水症状(如口渴、尿色深)时才考虑添加,否则容易造成电解质紊乱。
|
155 |
+
```
|
156 |
+
|
157 |
+
|
158 |
+
模型文件组成:
|
159 |
+
```
|
160 |
+
ziya-llama-13b-medical-lora
|
161 |
+
├── adapter_config.json
|
162 |
+
└── adapter_model.bin
|
163 |
+
```
|
164 |
+
|
165 |
+
|
166 |
+
### Inference Examples
|
167 |
+
|
168 |
+
|
169 |
+
|
170 |
+
| Human | Assitant |
|
171 |
+
|------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
172 |
+
| 小孩发烧怎么办 | 发烧是身体对感染或其他疾病的自然反应。以下是一些可以帮助缓解发烧症状的建议:<br/>1. 保持身体水分充足:发烧时,身体会失去水分,因此需要保持水分充足。<br/>2. 使用冰袋:将冰袋放在额头或颈部可以帮助降低体温。<br/>3. 使用退烧药:退烧药可以帮助降低体温。<br/>4. 保持身体温度:保持身体温度可以帮助降低体温。<br/>5. 使用冷水或温水擦拭身体:使用冷水或温水擦拭身体可以帮助降低体温。<br/>6. 使用退烧药:退烧药可以帮助降低体温。<br/>7. 保持身体温度:保持身体温度可以帮助降低体温。<br/>8. 使用冷水或温水擦拭身体:使用冷水或温水擦拭身体可以帮助降低体温。<br/>9. 使用退烧药:退烧药可以帮助降低体温。<br/>10. 保持身体温度:保持身体温度可以帮助降低体温。 |
|
173 |
+
| 一岁宝宝发烧能吃啥药? | 1岁宝宝发烧时,可以考虑以下几种药物:<br/>1. 退烧药:如布洛芬(Ibuprofen)或对乙酰氨基酚(Paracetamol)。这些药物可以帮助降低体温,缓解发烧症状。<br/>2. 抗生素:如果发烧是由细菌感染引起的,可以考虑使用抗生素。但请务必在医生的建议下使用。<br/>3. 抗病毒药物:如果发烧是由病毒感染引起的,可以考虑使用抗病毒药物。但请务必在医生的建议下使用。<br/>4. 解热镇痛药:如阿司匹林(Aspirin)或对乙酰氨基酚(Paracetamol)。这些药物可以帮助缓解发烧症状。<br/>5. 抗组胺药:如苯海拉明(Diphenhydramine)或非索非那定(Naproxen)。这些药物可以帮助缓解发烧症状。<br/>请务必在医生的建议下使用这些药物,并遵循药物说明书上的用量和用法。同时,保持宝宝充足的水分摄入,并确保宝宝有足够的休息。 |
|
174 |
+
| 肛门病变可能是什么疾病的症状 | 肛门病变可能由多种原因引起,包括感染、炎症、肿瘤或其他疾病。一些常见的肛门病变包括:<br/>1. 肛裂:这是一种肛门皮肤撕裂,通常由便秘或其他压力因素引起。<br/>2. 肛瘘:这是一种肛门感染,导致肛门皮肤和直肠之间形成瘘管。<br/>3. 肛门疣:这是一种肛门皮肤上形成的疣状病变,通常由人类乳头状瘤病毒(HPV)引起。<br/>4. 肛门脓肿:这是一种肛门感染,导致肛门皮肤下形成脓肿。<br/>5. 肛门肿瘤:这是一种肛门皮肤或直肠内形成的肿瘤。<br/>6. 肛门溃疡:这是一种肛门皮肤上形成的溃疡,通常由感染或炎症引起。<br/>7. 肛门瘙痒:这是一种肛门皮肤瘙痒的症状,可能由感染、炎症或其他疾病引起。<br/>如果您有肛门病变的症状,请咨询医疗保健专业人员以获得适当的诊断和治疗。 |
|
175 |
+
| 医生,您好白带增多泛黄怎么回事? | 您好,白带增多和发黄可能是由多种原因引起的,包括感染、荷尔蒙变化、阴道干燥或其他妇科问题。以下是一些可能的原因:<br/>1. 感染:白带增多和发黄可能是由阴道或尿道感染引起的。感染可能由细菌、病毒或真菌引起。<br/>2. 荷尔蒙变化:荷尔蒙变化,如月经周期或更年期,可能会导致白带增多和发黄。<br/>3. 阴道干燥:阴道干燥可能会导致白带增多和发黄。<br/>4. 其他妇科问题:其他妇科问题,如子宫颈炎、子宫内膜炎或子宫内膜异位症,也可能导致白带增多和发黄。<br/>如果您担心自己的白带,建议您咨询妇科医生进行检查和诊断。医生可以根据您的症状和检查结果确定原因并提供适当的治疗。 |
|
176 |
+
| 药流后有巧克力白带是没流干净吗 | 药流后出现巧克力白带并不一定意味着没有流干净。巧克力白带是由于子宫内膜脱落和出血引起的,通常在药流后的一段时间内会出现。<br/><br/>药流后出现巧克力白带的原因可能包括:<br/><br/>1. 子宫内膜脱落:药流后,子宫内膜会脱落,导致出血。这种出血可能表现为巧克力白带。<br/>2. 感染:药流后,子宫内膜和宫颈口可能存在创伤,容易受到细菌感染。感染可能导致巧克力白带。<br/>3. 激素水平变化:药流后,激素水平可能发生变化,导致巧克力白带。<br/><br/>如果巧克力白带持续时间较长,或者伴有其他症状,如腹痛、发热、分泌物异味等,建议及时就诊,进行相关检查,如妇科检查、B超等,以确定是否存在感染或其他问题。在医生的指导下进行相应的治疗。 |
|
177 |
+
| 维胺酯维E乳膏能治理什么疾病 | 维胺酯维E乳膏是一种外用药物,主要用于治疗痤疮、脂溢性皮炎等皮肤病。它可以帮助减少皮肤油脂分泌,减轻炎症,促进皮肤修复。<br/><br/>需要注意的是,维胺酯维E乳膏并非万能药,对于某些皮肤病可能并不适用。在使用前,建议咨询医生或药师,了解药物的适应症、禁忌症、用法用量等信息。同时,使用药物时应遵循医嘱,避免自行滥用。 |
|
178 |
+
| 痤疮是什么原因导致的? | 痤疮,也称为粉刺,是由皮肤毛孔堵塞引起的。堵塞毛孔的原因有很多,包括:<br/>1. 皮脂腺过度活跃:皮脂腺产生过多油脂,导致毛孔堵塞。<br/>2. 毛孔堵塞:皮肤表面的死皮细胞、油脂和细菌堵塞毛孔。<br/>3. 炎症:痤疮通常伴随着炎症,这可能是由于皮肤感染或免疫系统对痤疮的反应引起的。<br/>4. 遗传因素:某些人可能更容易患痤疮,这可能是由于遗传因素引起的。<br/>5. 荷尔蒙变化:痤疮在青春期和月经期间更为常见,这可能是由于荷尔蒙变化引起的。<br/>6. 生活方式因素:某些生活方式因素,如压力、不良饮食和缺乏运动,也可能导致痤疮。<br/>7. 化妆品和护肤品:某些化妆品和护肤品可能导致痤疮,特别是那些含有刺激性成分的产品。<br/>8. 药物:某些药物,如口服避孕药,也可能导致痤疮。<br/>要预防痤疮,可以采取一些措施,如保持皮肤清洁、使用温和的护肤品、避免过度使用化妆品和护肤品、保持健康的生活方式和饮食习惯、避免压力和荷尔蒙变化。如果痤疮严重,可能需要寻求皮肤科医生的帮助。 |
|
179 |
+
| 脸上长青春痘怎么办,能吃啥药,需要注意啥 | 青春痘,又称痤疮,是一种常见的皮肤病。青春痘的治疗需要综合考虑饮食、生活习惯、药物等多个方面。以下是一些建议:<br/><br/>1. 饮食:<br/>* 避免高糖、高脂、高油的食物,如快餐、甜点、油炸食品等。<br/>* 多吃新鲜蔬菜、水果、全谷类食物,以增加纤维摄入,促进肠道蠕动。<br/>* 避免摄入过多的咖啡因、酒精、辛辣食物等刺激性食物。<br/><br/>2. 生活习惯:<br/>* 保持良好的作息时间,保证充足的睡眠。<br/>* 避免长时间使用电脑、手机等电子产品,以免辐射对皮肤造成刺激。<br/>* 保持皮肤清洁,每天早晚使用温和的洁面产品清洁皮肤。<br/>* 避免挤压青春痘,以免感染和留下疤痕。<br/><br/>3. 药物:<br/>* 外用药物:可以使用含有水杨酸、苯甲酸、壬二酸等成分的护肤品,帮助去除皮肤表面的角质,减少痘痘的形成。<br/>* 口服药物:如果青春痘严重,可以考虑口服抗生素、维生素B族、锌等药物,但需在医生指导下使用。<br/><br/>4. 注意:<br/>* 不要随意使用化妆品、护肤品,以免刺激皮肤。<br/>* 不要过度清洁皮肤,以免破坏皮肤屏障。<br/>* 保持心情舒畅,避免焦虑、抑郁等负面情绪。<br/><br/>总之,青春痘的治疗需要综合考虑饮食、生活习惯、药物等多个方面。在治疗过程中,要保持耐心和信心,遵循医生的建议,逐步改善皮肤状况。 |
|
180 |
+
| 由于输精管堵塞会不会导致男性不育?,医生您好,我同事这几天不开心,我问她怎么了,她说她老公输精管堵塞,所以一直没孩子,不是不想要,请问输精管堵塞会不会导致男性不育? | 输精管堵塞可能会导致男性不育。输精管是连接睾丸和尿道的一条管道,负责将精子从睾丸输送到尿道。如果输精管堵塞,精子就无法通过输精管到达尿道,从而导致不育。<br/><br/>输精管堵塞的原因有很多,包括先天性发育异常、炎症、肿瘤、外伤等。输精管堵塞的治疗方法包括手术疏通、药物治疗等。如果输精管堵塞严重,可能需要进行手术疏通。<br/><br/>需要注意的是,输精管堵塞并不一定导致不育,因为还有其他途径可以将精子输送到女性体内。例如,精子可以通过附睾、前列腺等组织到达女性体内。因此,如果输精管堵塞,建议及时就医,寻求专业医生的帮助。 |
|
181 |
+
| 心肌梗塞能治疗吗? | 心肌梗死是一种严重的疾病,如果及时治疗,可以挽救生命并防止长期残疾。治疗心肌梗死的关键是尽早识别和治疗。<br/><br/>心肌梗死的治疗通常包括以下步骤:<br/><br/>1. 立即就医:如果出现胸痛、呼吸急促或晕厥等症状,立即就医。<br/><br/>2. 药物治疗:医生可能会开处方药物,如硝酸甘油或阿司匹林,以帮助缓解症状并防止进一步的损伤。<br/><br/>3. 溶栓治疗:如果患者在到达医院前出现心肌梗死,医生可能会进行溶栓治疗,通过注射溶解血栓的药物来帮助恢复血流。<br/><br/>4. 手术治疗:如果药物治疗或溶栓治疗无效,医生可能会建议进行手术,如冠状动脉搭桥手术或心脏支架植入术。<br/><br/>5. 康复和预防:心肌梗死的治疗通常包括康复计划,以帮助患者恢复身体功能并预防未来的心脏事件。此外,患者还应遵循医生的建议,以降低患心脏病的风险。<br/><br/>需要注意的是,心肌梗死的治疗取决于患者的具体情况和症状。因此,如果您或您认识的人出现心肌梗死症状,请立即就医。 |
|
182 |
+
| 怎么让自己精力充沛,列5点建议 | 1. 保持充足的睡眠:睡眠对于保持精力充沛至关重要。确保每晚获得7-9小时的高质量睡眠。<br/>2. 均衡饮食:均衡饮食对于保持能量水平至关重要。确保摄入足够的蛋白质、碳水化合物和健康脂肪。<br/>3. 定期锻炼:定期锻炼可以帮助提高能量水平。尝试每天进行至少30分钟的有氧运动,如散步、跑步或骑自行车。<br/>4. 管理压力:压力会消耗能量,因此管理压力对于保持精力充沛至关重要。尝试找到放松和减压的方法,如冥想、瑜伽或深呼吸练习。<br/>5. 保持水分:脱水会降低能量水平。确保每天喝足够的水,并根据需要补充水分。 |
|
183 |
+
| 写个春天的诗 | 春天,<br/>是大地苏醒的季节,<br/>是万物复苏的季节,<br/>是生命绽放的季节。<br/>春天,<br/>是阳光明媚的季节,<br/>是鸟语花香的季节,<br/>是绿意盎然的季节,<br/>是希望无限的季节。<br/>春天,<br/>是人们欢笑的季节,<br/>是孩子们嬉戏的季节,<br/>是恋人们相拥的季节,<br/>是人们追求梦想的季节。 |
|
184 |
+
| 南极洲为啥没有北极熊? | 南极洲没有北极熊,因为北极熊生活在北极地区,而南极洲位于南半球,气候和环境与北极地区有很大不同。南极洲的气候非常寒冷,常年被冰雪覆盖,而北极熊则生活在北极地区,那里有丰富的海洋生物和陆地哺乳动物。此外,南极洲的生态系统也与北极地区不同,没有北极熊所需的生存条件。 |
|
185 |
+
|
186 |
+
|
187 |
+
### 训练数据集
|
188 |
+
|
189 |
+
- 10万条多语言ShareGPT GPT4多轮对话数据集:[shibing624/sharegpt_gpt4](https://huggingface.co/datasets/shibing624/sharegpt_gpt4)
|
190 |
+
|
191 |
+
如果需要训练ChatGLM/LLAMA/BLOOM模型,请参考[https://github.com/shibing624/textgen](https://github.com/shibing624/textgen) 或 [shibing624/MedicalGPT](https://github.com/shibing624/MedicalGPT)
|
192 |
+
|
193 |
+
- training script:
|
194 |
+
|
195 |
+
```shell
|
196 |
+
CUDA_VISIBLE_DEVICES=0,1,2 torchrun --nproc_per_node 3 supervised_finetuning.py \
|
197 |
+
--model_type baichuan \
|
198 |
+
--model_name_or_path baichuan-inc/Baichuan-13B-Chat \
|
199 |
+
--train_file_dir path_of_sharegpt_gpt4 \
|
200 |
+
--validation_file_dir data/finetune/ \
|
201 |
+
--per_device_train_batch_size 2 \
|
202 |
+
--per_device_eval_batch_size 2 \
|
203 |
+
--template_name vicuna \
|
204 |
+
--do_train \
|
205 |
+
--do_eval \
|
206 |
+
--use_peft True --bf16 \
|
207 |
+
--max_train_samples -1 \
|
208 |
+
--max_source_length 1024 --max_target_length 1024 \
|
209 |
+
--max_eval_samples 50 \
|
210 |
+
--num_train_epochs 3 \
|
211 |
+
--learning_rate 2e-5 \
|
212 |
+
--warmup_ratio 0.05 \
|
213 |
+
--weight_decay 0.05 \
|
214 |
+
--logging_strategy steps \
|
215 |
+
--logging_steps 10 \
|
216 |
+
--eval_steps 50 \
|
217 |
+
--evaluation_strategy steps \
|
218 |
+
--save_steps 1000 \
|
219 |
+
--save_strategy steps \
|
220 |
+
--save_total_limit 13 \
|
221 |
+
--preprocessing_num_workers 10 \
|
222 |
+
--output_dir outputs-sft--baichuan-v3-production \
|
223 |
+
--overwrite_output_dir \
|
224 |
+
--ddp_timeout 300000 \
|
225 |
+
--logging_first_step True \
|
226 |
+
--target_modules all \
|
227 |
+
--lora_rank 8 \
|
228 |
+
--lora_alpha 16 \
|
229 |
+
--lora_dropout 0.05 \
|
230 |
+
--torch_dtype bfloat16 --optim paged_adamw_32bit \
|
231 |
+
--device_map auto \
|
232 |
+
--report_to tensorboard \
|
233 |
+
--ddp_find_unused_parameters False \
|
234 |
+
--gradient_checkpointing True --qlora True --cache_dir ./cache
|
235 |
+
```
|
236 |
+
- 机器:3*A100(40G), 36hours
|
237 |
+
|
238 |
+
|
239 |
+
|
240 |
+
## Citation
|
241 |
+
|
242 |
+
```latex
|
243 |
+
@software{textgen,
|
244 |
+
author = {Ming Xu},
|
245 |
+
title = {textgen: Implementation of language model finetune},
|
246 |
+
year = {2023},
|
247 |
+
url = {https://github.com/shibing624/textgen},
|
248 |
+
}
|
249 |
+
```
|