Update README.md
Browse files
README.md
CHANGED
@@ -27,11 +27,13 @@ ChatYuan-large-v2是ChatYuan系列中以轻量化实现高质量效果的模型
|
|
27 |
|
28 |
# 声明
|
29 |
文本由模型生成的结果, 请谨慎辨别和参考, 不代表任何人观点
|
|
|
|
|
30 |
请在法律允许的范围内使用,详见LICENSE
|
31 |
|
32 |
<a href='https://www.cluebenchmarks.com/clueai.html'>PromptCLUE-large</a>在1000亿token中文语料上预训练,累计学习1.5万亿中文token,并且在数百种任务上进行Prompt任务式训练。针对理解类任务,如分类、情感分析、抽取等,可以自定义标签体系;针对多种生成任务,可以进行采样自由生成。
|
33 |
|
34 |
-
<a href='https://
|
35 |
<a href='https://www.clueai.cn' target="__blank">使用API(large版)</a> |
|
36 |
<a href='https://github.com/clue-ai/ChatYuan' target="__blank">Github项目地址</a> |
|
37 |
<a href='https://colab.research.google.com/drive/1ZcLIJuemiojigrfjbsDMBWrX7JqXZX6I?usp=sharing' target="__blank">Colab在线试用</a> |
|
@@ -52,6 +54,12 @@ ChatYuan-large-v2是ChatYuan系列中以轻量化实现高质量效果的模型
|
|
52 |
from transformers import T5Tokenizer, T5ForConditionalGeneration
|
53 |
tokenizer = T5Tokenizer.from_pretrained("ClueAI/ChatYuan-large-v2")
|
54 |
model = T5ForConditionalGeneration.from_pretrained("ClueAI/ChatYuan-large-v2")
|
|
|
|
|
|
|
|
|
|
|
|
|
55 |
```
|
56 |
|
57 |
使用模型进行预测推理方法:
|
@@ -403,6 +411,8 @@ chatyuan-large-v2
|
|
403 |
|
404 |
### 数学计算
|
405 |
|
|
|
|
|
406 |
- 计算256+998
|
407 |
|
408 |
```
|
@@ -418,14 +428,33 @@ chatyuan-large-v2
|
|
418 |
两个数字位数最大的数字是998921,它的位数为:6
|
419 |
117的位数为3位,少于最大位数,所以需要在左边补充0对齐:000117
|
420 |
000117从右开始,从第1位到第6位分别是711000
|
421 |
-
998921
|
422 |
第1位:7 + 1 = 8,8小于10,无需进位,记为8
|
423 |
-
第2位:1 + 2 = 3,3小于10
|
424 |
-
第3位:1 +
|
425 |
-
第4位:0 +
|
426 |
-
第5位:0 +
|
427 |
-
第6位:0
|
428 |
-
运算结果为:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
429 |
```
|
430 |
### 多轮对话
|
431 |
|
|
|
27 |
|
28 |
# 声明
|
29 |
文本由模型生成的结果, 请谨慎辨别和参考, 不代表任何人观点
|
30 |
+
|
31 |
+
|
32 |
请在法律允许的范围内使用,详见LICENSE
|
33 |
|
34 |
<a href='https://www.cluebenchmarks.com/clueai.html'>PromptCLUE-large</a>在1000亿token中文语料上预训练,累计学习1.5万亿中文token,并且在数百种任务上进行Prompt任务式训练。针对理解类任务,如分类、情感分析、抽取等,可以自定义标签体系;针对多种生成任务,可以进行采样自由生成。
|
35 |
|
36 |
+
<a href='https://huggingface.co/spaces/ClueAI/ChatYuan-large-v2' target="__blank">在线Demo huggingface space </a> |
|
37 |
<a href='https://www.clueai.cn' target="__blank">使用API(large版)</a> |
|
38 |
<a href='https://github.com/clue-ai/ChatYuan' target="__blank">Github项目地址</a> |
|
39 |
<a href='https://colab.research.google.com/drive/1ZcLIJuemiojigrfjbsDMBWrX7JqXZX6I?usp=sharing' target="__blank">Colab在线试用</a> |
|
|
|
54 |
from transformers import T5Tokenizer, T5ForConditionalGeneration
|
55 |
tokenizer = T5Tokenizer.from_pretrained("ClueAI/ChatYuan-large-v2")
|
56 |
model = T5ForConditionalGeneration.from_pretrained("ClueAI/ChatYuan-large-v2")
|
57 |
+
# 该加载方式,在最大长度为512时 大约需要6G多显存
|
58 |
+
# 如显存不够,可采用以下方式加载,进一步减少显存需求,约为3G
|
59 |
+
# model = T5ForConditionalGeneration.from_pretrained("ClueAI/ChatYuan-large-v2").half()
|
60 |
+
|
61 |
+
|
62 |
+
|
63 |
```
|
64 |
|
65 |
使用模型进行预测推理方法:
|
|
|
411 |
|
412 |
### 数学计算
|
413 |
|
414 |
+
- 推荐使用不采样的方式来使用数学计算功能(设置do_sample=False)
|
415 |
+
|
416 |
- 计算256+998
|
417 |
|
418 |
```
|
|
|
428 |
两个数字位数最大的数字是998921,它的位数为:6
|
429 |
117的位数为3位,少于最大位数,所以需要在左边补充0对齐:000117
|
430 |
000117从右开始,从第1位到第6位分别是711000
|
431 |
+
998921从右开始,从第1位到第6位分别是129899
|
432 |
第1位:7 + 1 = 8,8小于10,无需进位,记为8
|
433 |
+
第2位:1 + 2 = 3,3小于10,无需进位,记为3
|
434 |
+
第3位:1 + 9 = 10,10大于等于10,需要进位,所以记为0,将1进位
|
435 |
+
第4位:0 + 8 + 1(进位) = 9,9小于10,无需进位,记为9
|
436 |
+
第5位:0 + 9 = 9,9小于10,无需进位,记为9
|
437 |
+
第6位:0 + 9 = 9,9小于10,无需进位,记为9
|
438 |
+
运算结果为:999038
|
439 |
+
```
|
440 |
+
|
441 |
+
- 计算公式236588918+786777,并给出逻辑运算规则
|
442 |
+
|
443 |
+
```
|
444 |
+
两个数字位数最大的数字是236588918,它的位数为:9
|
445 |
+
786777的位数为6位,少于最大位数,所以需要在左边补充0对齐:000786777
|
446 |
+
236588918从右开始,从第1位到第9位分别是819825632
|
447 |
+
000786777从右开始,从第1位到第9位分别是777687000
|
448 |
+
第1位:8 + 7 = 15,15大于等于10,需要进位,所以记为5,将1进位
|
449 |
+
第2位:1 + 7 + 1(进位) = 9,9小于10,无需进位,记为9
|
450 |
+
第3位:9 + 7 = 16,16大于等于10,需要进位,所以记为6,将1进位
|
451 |
+
第4位:8 + 6 + 1(进位) = 15,15大于等于10,需要进位,所以记为5,将1进位
|
452 |
+
第5位:8 + 8 + 1(进位) = 17,17大于等于10,需要进位,所以记为7,将1进位
|
453 |
+
第6位:5 + 7 + 1(进位) = 13,13大于等于10,需要进位,所以记为3,将1进位
|
454 |
+
第7位:6 + 0 + 1(进位) = 7,7小于10,无需进位,记为7
|
455 |
+
第8位:3 + 0 = 3,3小于10,无需进位,记为3
|
456 |
+
第9位:2 + 0 = 2,2小于10,无需进位,记为2
|
457 |
+
运算结果为:237375695
|
458 |
```
|
459 |
### 多轮对话
|
460 |
|