yuyijiong
/

Qwen-14b-chat-yarn-32k

Text Generation

Model card Files Files and versions Community

yuyijiong commited on Jan 1

Commit

a445828

•

1 Parent(s): 943767e

Update README.md

Files changed (1) hide show

README.md +3 -2

README.md CHANGED Viewed

@@ -18,12 +18,13 @@ pipeline_tag: text-generation
 * 2023.12.14更新：发布经过微调的Qwen-14b-chat-yarn-32k，微调后的模型能适应32k长度（约4万汉字）的中英问答，相较于之前的通过位置插值得到的32k模型，几乎完全解决了多文档问答任务下召回率低（即 lost in middle 现象）的问题。
 <br>
-# 支持32k上下文(可自动扩展至50k以上)的的Qwen-14b-chat模型
 ## 模型的主要特性：
 * 基于Qwen-14b-chat，使用“原文复述”任务进行指令微调
 * 使用Yarn插值方法，使模型能适应32k甚至更长的文本
-* 推理时，无需特定prompt，即可给出高准确率的回答。
 <br>

 * 2023.12.14更新：发布经过微调的Qwen-14b-chat-yarn-32k，微调后的模型能适应32k长度（约4万汉字）的中英问答，相较于之前的通过位置插值得到的32k模型，几乎完全解决了多文档问答任务下召回率低（即 lost in middle 现象）的问题。
 <br>
+# 支持32k上下文(可自动扩展至50k以上)的Qwen-14b-chat模型
 ## 模型的主要特性：
 * 基于Qwen-14b-chat，使用“原文复述”任务进行指令微调
 * 使用Yarn插值方法，使模型能适应32k甚至更长的文本
+* 推理时，无需特殊设计的prompt，即可给出高准确率的回答。
+* Qwen原有能力并未退化，依然能够适应各种任务。
 <br>