Orion-14B-Chat / README.md

DachengZhang

Update README.md

fb970e8 verified 6 months ago

preview code

raw

history blame

No virus

21.1 kB

	---
	license: other
	license_name: orion
	license_link: https://github.com/OrionStarAI/Orion/blob/main/ORION_MODEL_LICENSE.txt
	widget:
	- text: "你好! 你叫什么名字!"
	output:
	text: "你好，我的名字叫聚言，很高兴见到你。"
	pipeline_tag: text-generation
	---

	<!-- markdownlint-disable first-line-h1 -->
	<!-- markdownlint-disable html -->
	![](./assets/imgs/orion_start.PNG)

	<div align="center">
	<h1>
	Orion-14B
	</h1>
	</div>

	<div align="center">


	<h4 align="center">
	<p>
	<b>🇨🇳中文</b> \|
	<a href="http://git.ainirobot.com/llm/Orion/blob/master/README_en.MD">🌐English</a><br><br>
	🤗 <a href="https://huggingface.co/OrionStarAI" target="_blank">HuggingFace主页</a> \| 🤖 <a href="https://modelscope.cn/organization/OrionStarAI" target="_blank">ModelScope主页 </a>\| 🎬 <a href="https://modelscope.cn/studios/OrionStarAI/Orion-14B/summary" target="_blank">在线试用</a>
	<p>
	</h4>

	</div>



	# 目录

	- [📖 模型介绍](#模型介绍)
	- [🔗 下载路径](#下载路径)
	- [🔖 评估结果](#评估结果)
	- [📊 模型推理](#模型推理)
	- [🥇 企业介绍](#企业介绍)
	- [📜 声明协议](#声明协议)

	# 模型介绍

	- Orion-14B-Base是一个具有140亿参数的多语种大模型，该模型在一个包含2.5万亿token的多样化数据集上进行了训练，涵盖了中文、英语、日语、韩语等多种语言。在多语言环境下的一系列任务中展现出卓越的性能。

	- 在主流的基准评测中，Orion-14B系列模型都具有超强的竞争力，显著超出同规模模型。从公开评估结果来看，Orion-14B系列模型也是首个评估超过三种语言的大语言模型，希望猎户星空全体同仁的贡献能够为多语言LLM研究领域建立一个新的基准

	- Orion-14B-Chat是基于Orion-14B-Base、使用85W左右的高质量语料微调而成(仅SFT)。

	- Orion-14B系列大语言模型包含:
	- Orion-14B-Base: 基于2.5万亿令牌多样化数据集训练处的140亿参数量级的多语言基座模型。
	- Orion-14B-Chat: 基于高质量语料库微调的对话类模型，旨在为大模型社区提供更好的用户交互体验。
	- Orion-14B-LongChat: 支持长度超过200K令牌上下文的交互，在长文本评估集上性能比肩专有模型。
	- Orion-14B-Chat-RAG: 在一个定制的检索增强生成数据集上进行微调的聊天模型，在检索增强生成任务中取得了卓越的性能。
	- Orion-14B-Chat-Plugin: 专门针对插件和函数调用任务定制的聊天模型，非常适用于使用代理的相关场景，其中大语言模型充当插件和函数调用系统。
	- Orion-14B-Base-Int4: 一个使用4位整数进行量化的基座模型。它将模型大小显著减小了70%，同时提高了推理速度30%，仅引入了1%的最小性能损失。
	- Orion-14B-Chat-Int4: 一个使用4位整数进行量化的对话模型。

	# 下载路径

	发布模型和下载链接见下表：

	\| 模型名称 \| HuggingFace下载链接 \| ModelScope下载链接 \|
	\|---------------------\|-----------------------------------------------------------------------------------\|------------------------------------------------------------------------------------------------\|
	\| ⚾ 基座模型 \| [Orion-14B-Base](https://huggingface.co/OrionStarAI/Orion-14B-Base) \| [Orion-14B-Base](https://modelscope.cn/models/OrionStarAI/Orion-14B-Base/summary) \|
	\| 😛 对话模型 \| [Orion-14B-Chat](https://huggingface.co/OrionStarAI/Orion-14B-Chat) \| [Orion-14B-Chat](https://modelscope.cn/models/OrionStarAI/Orion-14B-Chat/summary) \|
	\| 📃 长上下文模型 \| [Orion-14B-LongChat](https://huggingface.co/OrionStarAI/Orion-14B-LongChat) \| [Orion-14B-LongChat](https://modelscope.cn/models/OrionStarAI/Orion-14B-LongChat/summary) \|
	\| 🔎 检索增强模型 \| [Orion-14B-Chat-RAG](https://huggingface.co/OrionStarAI/Orion-14B-Chat-RAG) \| [Orion-14B-Chat-RAG](https://modelscope.cn/models/OrionStarAI/Orion-14B-Chat-RAG/summary) \|
	\| 🔌 插件模型 \| [Orion-14B-Chat-Plugin](https://huggingface.co/OrionStarAI/Orion-14B-Chat-Plugin) \| [Orion-14B-Chat-Plugin](https://modelscope.cn/models/OrionStarAI/Orion-14B-Chat-Plugin/summary)\|
	\| 💼 基座Int4量化模型 \| [Orion-14B-Base-Int4](https://huggingface.co/OrionStarAI/Orion-14B-Base-Int4) \| [Orion-14B-Base-Int4](https://modelscope.cn/models/OrionStarAI/Orion-14B-Base-Int4/summary) \|
	\| 📦 对话Int4量化模型 \| [Orion-14B-Chat-Int4](https://huggingface.co/OrionStarAI/Orion-14B-Chat-Int4) \| [Orion-14B-Chat-Int4](https://modelscope.cn/models/OrionStarAI/Orion-14B-Chat-Int4/summary) \|

	# 评估结果

	## 专业知识与试题评估结果
	\| 模型名称 \| C-Eval \| CMMLU \| MMLU \| AGIEval \| Gaokao \| BBH \|
	\|--------------------\|----------\|----------\|----------\|----------\|----------\|----------\|
	\| LLaMA2-13B \| 41.4 \| 38.4 \| 55.0 \| 30.9 \| 18.2 \| 45.6 \|
	\| Skywork-13B \| 59.1 \| 61.4 \| 62.7 \| 43.6 \| 56.1 \| 48.3 \|
	\| Baichuan2-13B \| 59.0 \| 61.3 \| 59.5 \| 37.4 \| 45.6 \| 49.0 \|
	\| QWEN-14B \| 71.7 \| 70.2 \| 67.9 \| 51.9 \| 62.5 \| 53.7 \|
	\| InternLM-20B \| 58.8 \| 59.0 \| 62.1 \| 44.6 \| 45.5 \| 52.5 \|
	\| Orion-14B \| 72.9 \| 70.6 \| 69.9 \| 54.7 \| 62.1 \| 56.5 \|


	## 理解与通识评估结果
	\| 模型名称 \|RACE-middle\|RACE-high\| HellaSwag\| PIQA \| Lambada \| WSC \|
	\|--------------------\|----------\|----------\|----------\|----------\|----------\|----------\|
	\| LLaMA 2-13B \| 63.0 \| 58.9 \| 77.5 \| 79.8 \| 76.5 \| 66.3 \|
	\| Skywork-13B \| 87.6 \| 84.1 \| 73.7 \| 78.3 \| 71.8 \| 66.3 \|
	\| Baichuan 2-13B \| 68.9 \| 67.2 \| 70.8 \| 78.1 \| 74.1 \| 66.3 \|
	\| QWEN-14B \| 93.0 \| 90.3 \| 80.2 \| 79.8 \| 71.4 \| 66.3 \|
	\| InternLM-20B \| 86.4 \| 83.3 \| 78.1 \| 80.3 \| 71.8 \| 68.3 \|
	\| Orion-14B \| 93.3 \| 91.3 \| 78.5 \| 79.5 \| 78.9 \| 70.2 \|


	## OpenCompass评测集评估结果
	\| 模型名称 \| Average \| Examination \| Language \| Knowledge \| Understanding \| Reasoning \|
	\|-----------------\|----------\|----------\|----------\|----------\|----------\|----------\|
	\| LLaMA 2-13B \| 47.3 \| 45.2 \| 47.0 \| 58.3 \| 50.9 \| 43.6 \|
	\| Skywork-13B \| 53.6 \| 61.1 \| 51.3 \| 52.7 \| 64.5 \| 45.2 \|
	\| Baichuan 2-13B \| 49.4 \| 51.8 \| 47.5 \| 48.9 \| 58.1 \| 44.2 \|
	\| QWEN-14B \| 62.4 \| 71.3 \| 52.67 \| 56.1 \| 68.8 \| 60.1 \|
	\| InternLM-20B \| 59.4 \| 62.5 \| 55.0 \| 60.1 \| 67.3 \| 54.9 \|
	\| Orion-14B \| 64.4 \| 71.4 \| 55.0 \| 60.0 \| 71.9 \| 61.6 \|


	## 日语测试集评估结果
	\| 模型名称 \|Average\| JCQA \| JNLI \| MARC \| JSQD \| JQK \| XLS \| XWN \| MGSM \|
	\|--------------------\|----------\|----------\|----------\|----------\|----------\|----------\|----------\|----------\|----------\|
	\| PLaMo-13B \| 52.3 \| 56.7 \| 42.8 \| 95.8 \| 70.6 \| 71.0 \| 8.70 \| 70.5 \| 2.40 \|
	\| WebLab-10B \| 50.7 \| 66.6 \| 53.7 \| 82.1 \| 62.9 \| 56.2 \| 10.0 \| 72.0 \| 2.40 \|
	\| ELYZA-jp-7B \| 48.8 \| 71.7 \| 25.3 \| 86.6 \| 70.8 \| 64.1 \| 2.50 \| 62.1 \| 7.20 \|
	\| StableLM-jp-7B \| 51.1 \| 33.4 \| 43.3 \| 96.7 \| 70.6 \| 78.1 \| 10.7 \| 72.8 \| 2.80 \|
	\| LLaMA 2-13B \| 46.3 \| 75.0 \| 47.6 \| 38.8 \| 76.1 \| 67.7 \| 18.1 \| 63.2 \| 10.4 \|
	\| Baichuan 2-13B \| 57.1 \| 73.7 \| 31.3 \| 91.6 \| 80.5 \| 63.3 \| 18.6 \| 72.2 \| 25.2 \|
	\| QWEN-14B \| 65.8 \| 85.9 \| 60.7 \| 97.0 \| 83.3 \| 71.8 \| 18.8 \| 70.6 \| 38.0 \|
	\| Yi-34B \| 67.1 \| 83.8 \| 61.2 \| 95.2 \| 86.1 \| 78.5 \| 27.2 \| 69.2 \| 35.2 \|
	\| Orion-14B \| 69.1 \| 88.2 \| 75.8 \| 94.1 \| 75.7 \| 85.1 \| 17.3 \| 78.8 \| 38.0 \|


	## 韩语测试集n-shot评估结果
	\| 模型名称 \| Average<br>n=0  n=5 \| HellaSwag<br>n=0  n=5 \| COPA<br> n=0  n=5 \| BooIQ<br>n=0  n=5 \| SentiNeg<br>n=0  n=5\|
	\|-----------------\|------------------------------\|------------------------------\|------------------------------\|------------------------------\|------------------------------\|
	\| KoGPT \| 53.0    70.1 \| 55.9    58.3 \| 73.5    72.9 \| 45.1    59.8 \| 37.5    89.4 \|
	\| Polyglot-ko-13B \| 69.6    73.7 \|59.5    63.1\|79.4    81.1\| 48.2    60.4 \| 91.2    90.2 \|
	\| LLaMA 2-13B \| 46.7    63.7 \| 41.3    44.0 \| 59.3    63.8 \| 34.9    73.8 \| 51.5    73.4 \|
	\| Baichuan 2-13B \| 52.1    58.7 \| 39.2    39.6 \| 60.6    60.6 \| 58.4    61.5 \| 50.3    72.9 \|
	\| QWEN-14B \| 53.8    73.7 \| 45.3    46.8 \| 64.9    68.9 \| 33.4    83.5 \| 71.5    95.7 \|
	\| Yi-34B \| 54.2    72.1 \| 44.6    44.7 \| 58.0    60.6 \| 65.9    90.2 \| 48.3    92.9 \|
	\| Orion-14B \|74.5    79.6\| 47.0    49.6 \| 77.7    79.4 \|81.6    90.7\|92.4    98.7\|

	## 多语言评估结果
	\| 模型名称 \| Train Lang \| Japanese \| Korean \| Chinese \| English \|
	\|--------------------\|------------\|----------\|----------\|----------\|----------\|
	\| PLaMo-13B \| En,Jp \| 52.3 \| * \| * \| * \|
	\| Weblab-10B \| En,Jp \| 50.7 \| * \| * \| * \|
	\| ELYZA-jp-7B \| En,Jp \| 48.8 \| * \| * \| * \|
	\| StableLM-jp-7B \| En,Jp \| 51.1 \| * \| * \| * \|
	\| KoGPT-6B \| En,Ko \| * \| 70.1 \| * \| * \|
	\| Polyglot-ko-13B \| En,Ko \| * \| 70.7 \| * \| * \|
	\| Baichuan2-13B \| Multi \| 57.1 \| 58.7 \| 50.8 \| 57.1 \|
	\| Qwen-14B \| Multi \| 65.8 \| 73.7 \| 64.5 \| 65.4 \|
	\| Llama2-13B \| Multi \| 46.3 \| 63.7 \| 41.4 \| 55.3 \|
	\| Yi-34B \| Multi \| 67.1 \| 72.2 \| 58.7 \| 68.8 \|
	\| Orion-14B \| Multi \| 69.1 \| 79.5 \| 67.9 \| 67.3 \|

	## 污染与过拟合数据集评估结果
	\| 模型名称 \| C-Eval \| CMMLU \| MMLU \| Lambada \| HellaSwag \|
	\|------------------------\|----------\|----------\|----------\|----------\|----------\|
	\| GPT-4 \| 69.9 \| 71.0 \| 83.0 \| 65.5 \| 91.4 \|
	\| Qwen-72B \| 83.3 \| 61.8 \| 77.3 \| 76.1 \| 85.4 \|
	\| Yi-34B \| 81.8 \| 82.6 \| 76.3 \| 73.1 \| 82.0 \|
	\| Orion-14B \| 72.8 \| 70.6 \| 69.9 \| 78.8 \| 78.5 \|
	\| Orion-14B(contaminated)\| 92.7 \| 82.9 \| 85.4 \| 78.5 \| 85.8 \|


	## 对话模型标准评估
	\| 模型名称 \| CMMLU \| MMLU \| BBH \|HellaSwag \| PIQA \| WSC \|
	\|----------------------\|----------\|----------\|----------\|----------\|----------\|----------\|
	\| Baichuan2-13B-Chat \| 58.4 \| 57.0 \| 49.9 \| 66.9 \| 77.6 \| 71.2 \|
	\| Qwen-14B-Chat \| 70.0 \| 66.4 \| 58.0 \| 65.2 \| 74.0 \| 66.3 \|
	\| Llama2-13B-Chat \| 38.7 \| 54.6 \| 40.2 \| 78.2 \| 78.8 \| 68.3 \|
	\| InternLM-20B-Chat \| 52.2 \| 52.5 \| 35.3 \| 69.2 \| 76.7 \| 61.5 \|
	\| Orion-14B-Chat \| 63.7 \| 61.71 \| 49.05 \| 76.7 \| 78.4 \| 71.15 \|

	## 对话模型MTBench主观评估
	\| 模型名称 \| 第一轮 \| 第二轮 \| 平均 \|
	\|----------------------\|----------\|----------\|----------\|
	\| Baichuan2-13B-Chat \| 7.05 \| 6.47 \| 6.76 \|
	\| Qwen-14B-Chat \| 7.30 \| 6.62 \| 6.96 \|
	\| Llama2-13B-Chat \| 7.10 \| 6.20 \| 6.65 \|
	\| InternLM-20B-Chat \| 7.03 \| 5.93 \| 6.48 \|
	\| Orion-14B-Chat \| 7.68 \| 7.07 \| 7.37 \|

	## 对话模型AlignBench主观评估
	\| 模型名称 \| 数学能力 \| 逻辑推理 \| 基本能力 \| 中文理解 \| 综合问答 \| 写作能力 \| 角色扮演 \| 专业知识 \| 平均 \|
	\|--------------------\|----------\|----------\|----------\|----------\|----------\|----------\|----------\|----------\|----------\|
	\| Baichuan2-13B-Chat \| 3.76 \| 4.07 \| 6.22 \| 6.05 \| 7.11 \| 6.97 \| 6.75 \| 6.43 \| 5.25 \|
	\| Qwen-14B-Chat \| 4.91 \| 4.71 \| 6.90 \| 6.36 \| 6.74 \| 6.64 \| 6.59 \| 6.56 \| 5.72 \|
	\| Llama2-13B-Chat \| 3.05 \| 3.79 \| 5.43 \| 4.40 \| 6.76 \| 6.63 \| 6.99 \| 5.65 \| 4.70 \|
	\| InternLM-20B-Chat \| 3.39 \| 3.92 \| 5.96 \| 5.50 \| 7.18 \| 6.19 \| 6.49 \| 6.22 \| 4.96 \|
	\| Orion-14B-Chat \| 4.00 \| 4.24 \| 6.18 \| 6.57 \| 7.16 \| 7.36 \| 7.16 \| 6.99 \| 5.51 \|


	# 模型推理

	推理所需的模型权重、源码、配置已发布在 Hugging Face，下载链接见本文档最开始的表格。我们在此示范多种推理方式。程序会自动从
	Hugging Face 下载所需资源。

	## Python 代码方式

	```python
	import torch
	from transformers import AutoModelForCausalLM, AutoTokenizer
	from transformers.generation.utils import GenerationConfig

	tokenizer = AutoTokenizer.from_pretrained("OrionStarAI/Orion-14B", use_fast=False, trust_remote_code=True)
	model = AutoModelForCausalLM.from_pretrained("OrionStarAI/Orion-14B", device_map="auto",
	torch_dtype=torch.bfloat16, trust_remote_code=True)

	model.generation_config = GenerationConfig.from_pretrained("OrionStarAI/Orion-14B")
	messages = [{"role": "user", "content": "你好! 你叫什么名字!"}]
	response = model.chat(tokenizer, messages, streaming=Flase)
	print(response)

	# 你好!我是一个人工智能助手,没有固定的名字。你可以随意称呼我。有什么我可以帮助你的吗?
	```

	在上述两段代码中，模型加载指定 `device_map='auto'`
	，会使用所有可用显卡。如需指定使用的设备，可以使用类似 `export CUDA_VISIBLE_DEVICES=0,1`（使用了0、1号显卡）的方式控制。

	## 命令行工具方式

	```shell
	CUDA_VISIBLE_DEVICES=0 python cli_demo.py
	```

	本命令行工具是为 Chat 场景设计，因此我们不支持使用该工具调用 Base 模型。

	## 脚本直接推理

	```shell
	# base model
	CUDA_VISIBLE_DEVICES=0 python demo/text_generation_base.py --model OrionStarAI/Orion-14B --tokenizer OrionStarAI/Orion-14B --prompt 你好,你叫什么名字

	# chat model
	CUDA_VISIBLE_DEVICES=0 python demo/text_generation.py --model OrionStarAI/Orion-14B-Chat --tokenizer OrionStarAI/Orion-14B-Chat --prompt 你好,你叫什么名字
	```

	## 示例输出

	## 闲聊

	`````
	用户：你好,你叫什么名字
	Orion-14B：你好!我是一个人工智能助手,没有固定的名字。你可以随意称呼我。有什么我可以帮助你的吗?
	用户：讲个故事
	Orion-14B：从前有一个小男孩叫杰克,他住在一个小村庄里。杰克非常喜欢冒险和探索,总是梦想着能够发现一些神奇的事情。

	有一天,杰克听说在附近的森林深处有一座传说中的魔法城堡,里面住着一个邪恶的巨人。这个巨人的名字叫格里姆,他被困在城堡中,无法离开。

	杰克决定要去解救这个巨人,因为他相信格里姆一定有自己的原因被困在那里。于是,他带着勇气和决心,踏上了前往魔法城堡的旅程。

	经过长时间的跋涉,杰克终于来到了城堡的大门前。他小心翼翼地推开大门,进入了一个充满神秘气息的房间。

	房间里弥漫着黑暗的气息,但杰克并没有被吓倒。他勇敢地向城堡深处走去,最终找到了格里姆。

	格里姆告诉杰克,他是被一个邪恶的女巫诅咒的,只有通过解开咒语才能获得自由。杰克决定要帮助格里姆,他开始寻找线索和解开咒语的方法。

	经过一番努力,杰克终于找到了一条通往女巫的秘密实验室的道路。他在那里发现了女巫留下的魔法书,书中记载了解开咒语的方法。

	杰克按照书上所写的步骤进行操作,成功地解开了格里姆身上的诅咒。巨人感激不已,他答应帮助杰克实现他的愿望。

	从此以后,杰克和格里姆成为了好朋友,他们一起经历了许多惊险刺激的冒险,并用他们的勇气和智慧战胜了各种困难。

	这个故事告诉我们,只要有勇气和决心,我们就能克服一切困难,实现自己的梦想。
	`````

	## 日韩

	`````
	用户：自己を紹介してください
	Orion-14B：こんにちは、私の名前はChatMaxで、OrionStarによって開発されたAIアシスタントです。私はユーザーに正確で、客観的で、有用な回答を提供し、彼らが問題を解決し、情報を取得するのを助けることができます。
	用户：자기소개를 해주세요.
	Orion-14B：안녕하세요, 제 이름은 ChatMax입니다. OrionStar에서 개발한 AI 어시스턴트입니다. 저는 사용자들에게 정확하고 객관적이며 유용한 답변을 제공하여 문제를 해결하고 정보를 얻는 데 도움을 줄 수 있습니다.
	`````

	# 企业介绍

	猎户星空（OrionStar）是一家全球领先的服务机器人解决方案公司，成立于2016年9月。猎户星空致力于基于人工智能技术打造下一代革命性机器人，使人们能够摆脱重复的体力劳动，使人类的工作和生活更加智能和有趣，通过技术使社会和世界变得更加美好。

	猎户星空拥有完全自主开发的全链条人工智能技术，如语音交互和视觉导航。它整合了产品开发能力和技术应用能力。基于Orion机械臂平台，它推出了ORION
	STAR AI Robot Greeting、AI Robot Greeting Mini、Lucki、Coffee
	Master等产品，并建立了Orion机器人的开放平台OrionOS。通过为真正有用的机器人而生的理念实践，它通过AI技术为更多人赋能。

	凭借7年AI经验积累，猎户星空已推出的大模型深度应用“聚言”，并陆续面向行业客户提供定制化AI大模型咨询与服务解决方案，真正帮助客户实现企业经营效率领先同行目标。

	猎户星空具备全链条大模型应用能力的核心优势，包括拥有从海量数据处理、大模型预训练、二次预训练、微调(Fine-tune)、Prompt
	Engineering 、Agent开发的全链条能力和经验积累；拥有完整的端到端模型训练能力，包括系统化的数据处理流程和数百张GPU的并行模型训练能力，现已在大政务、云服务、出海电商、快消等多个行业场景落地。

	*欢迎有大模型应用落地需求的企业联系我们进行商务合作，咨询电话 400-898-7779 。*

	# 声明、协议

	## 声明

	我们强烈呼吁所有使用者，不要利用 Orion-14B 模型进行任何危害国家社会安全或违法的活动。另外，我们也要求使用者不要将
	Orion-14B 模型用于未经适当安全审查和备案的互联网服务。

	我们希望所有的使用者都能遵守这个原则，确保科技的发展能在规范和合法的环境下进行。
	我们已经尽我们所能，来确保模型训练过程中使用的数据的合规性。然而，尽管我们已经做出了巨大的努力，但由于模型和数据的复杂性，仍有可能存在一些无法预见的问题。因此，如果由于使用
	Orion-14B 开源模型而导致的任何问题，包括但不限于数据安全问题、公共舆论风险，或模型被误导、滥用、传播或不当利用所带来的任何风险和问题，我们将不承担任何责任。

	## 协议

	社区使用 Orion-14B
	模型需要遵循 [Orion-14B系列模型社区许可协议](https://github.com/OrionStarAI/Orion/blob/main/ORION_MODEL_LICENSE.txt)

	# 联系我们

	电子邮箱: ai@orionstar.com

	![](./assets/imgs/wechat_group.jpg)