File size: 15,343 Bytes
b5da0b6 a653c90 b5da0b6 a653c90 37ba5c3 b5da0b6 3a8936a b5da0b6 3a8936a 6f5c2ce b5da0b6 a653c90 0593f84 37ba5c3 151a260 a653c90 fff5583 a653c90 6e08f32 b5da0b6 fff5583 b5da0b6 a653c90 985fcdb fd3d54c a653c90 fd3d54c 49dc4c4 fd3d54c 8d3828f fd3d54c 985fcdb a653c90 49dc4c4 ecfe394 6deae97 6ed5b63 1ca5518 ecfe394 a653c90 b5da0b6 a653c90 3a8936a b5da0b6 a653c90 b5da0b6 aa84904 b5da0b6 3a8936a b5da0b6 3a8936a b5da0b6 3a8936a b5da0b6 3a8936a b5da0b6 3a8936a aa84904 b5da0b6 3a8936a b5da0b6 3a8936a fd3d54c 3a8936a fd3d54c fff5583 6e08f32 a1a0a74 f6fc453 fff5583 3a8936a f6fc453 3a8936a c72adb4 fd3d54c b5da0b6 a653c90 fd3d54c 490f507 fd3d54c b5da0b6 fff5583 d7a12c5 490f507 f8cf18b a653c90 f8cf18b 490f507 3a8936a 8d3828f d7a12c5 fff5583 3a8936a fd3d54c 7479e07 8d19f5f 7479e07 3a8936a b5da0b6 8d3828f fff5583 b7dec5f 89404ed b7dec5f a653c90 b7dec5f 89404ed a653c90 89404ed b7dec5f b63b5f7 cde44ab b7dec5f 26d20d3 e123b6b a653c90 26d20d3 a653c90 bf633c1 fff5583 b7dec5f 8d3828f 490f507 8d3828f 490f507 8d3828f b5da0b6 3a8936a fff5583 fd3d54c b5da0b6 fd3d54c 3a8936a fd3d54c 3a8936a a653c90 3a8936a 6e08f32 3a8936a 6e08f32 3a8936a fd3d54c c0531f2 |
|
import gradio as gr
import os
import json
import requests
import datetime
import pytz
# 流式端点
API_URL = "https://ai.fakeopen.com/v1/chat/completions" # 用户需要提供自己的 OPENAI_API_KEY
# 推断函数
def predict(openai_gptapi_key, model, system_msg, inputs, top_p, temperature, max_tokens, presence_penalty, frequency_penalty, chat_counter, chatbot=[], history=[]):
print(f"——————————————————————————————")
# 获取当前中国时间
current_time = datetime.datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y年-%m月-%d日 %H时:%M分:%S秒")
if inputs.strip() == '':
inputs = "你好呀,使用英语与中文简单介绍下你自己吧!"
if openai_gptapi_key.strip() == '':
openai_gptapi_key = "pk-this-is-a-real-free-pool-token-for-everyone"
print(f"[{current_time}] 聊天:API密钥 - Fake Open 服务提供的免费共享密钥")
else:
print(f"[{current_time}] 聊天:API密钥 - {openai_gptapi_key}")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {openai_gptapi_key}" # 用户将提供自己的 OPENAI_API_KEY
}
print(f"[{current_time}] 聊天:用户消息 - {inputs}")
if system_msg.strip() == '':
initial_message = [{"role": "user", "content": f"{inputs}"},]
multi_turn_message = []
else:
initial_message= [{"role": "system", "content": system_msg},
{"role": "user", "content": f"{inputs}"},]
multi_turn_message = [{"role": "system", "content": system_msg},]
print(f"[{current_time}] 聊天:系统消息 - {system_msg}")
"""if chat_counter == 0 :
payload = {
"model": "gpt-4",
"messages": initial_message ,
"temperature" : 1.0,
"top_p":1.0,
"n" : 1,
"stream": True,
"presence_penalty":0,
"frequency_penalty":0,
}
chat_counter+=1
print(f"聊天:对话计数 - {chat_counter}")
else: # 如果 chat_counter 不等于 0"""
messages=multi_turn_message # 类型为 - [{"role": "system", "content": system_msg},]
for data in chatbot:
user = {}
user["role"] = "user"
user["content"] = data[0]
assistant = {}
assistant["role"] = "assistant"
assistant["content"] = data[1]
messages.append(user)
messages.append(assistant)
temp = {}
temp["role"] = "user"
temp["content"] = inputs
messages.append(temp)
# 消息
payload = {
"model": model,
"messages": messages, # 类型为 [{"role": "user", "content": f"{inputs}"}],
"temperature": temperature, # 温度
"top_p": top_p, # Top-p
"n": 1,
"stream": True,
"presence_penalty": presence_penalty, # 存在惩罚
"frequency_penalty": frequency_penalty, # 频率惩罚
"max_tokens": max_tokens # 最大 Token 数
}
chat_counter+=1
print(f"[{current_time}] 聊天:对话计数 - {chat_counter}")
history.append(inputs)
print(f"[{current_time}] 日志:发送数据 - {payload}")
# 使用 requests.post 方法向 API 端点发出 POST 请求,传递 stream=True
response = requests.post(API_URL, headers=headers, json=payload, stream=True)
print(f"[{current_time}] 服务:响应代码 - {response}")
token_counter = 0
partial_words = ""
counter=0
partial_words = ""
for chunk in response.iter_lines():
# 跳过第一个块
if counter == 0:
counter+=1
continue
# 检查每行是否非空
if chunk.decode() :
chunk = chunk.decode()
# 将每行解码为响应数据,因为响应数据是以字节形式返回的
if len(chunk) > 12 and "content" in json.loads(chunk[6:])['choices'][0]['delta']:
partial_words = partial_words + json.loads(chunk[6:])['choices'][0]["delta"]["content"]
if token_counter == 0:
history.append(" " + partial_words)
else:
history[-1] = partial_words
chat = [(history[i], history[i + 1]) for i in range(0, len(history) - 1, 2) ] # 转换为列表的元组
token_counter+=1
yield chat, history, chat_counter, response # 类似于 {chatbot: chat, state: history}
print(f"[{current_time}] 聊天:模型回复 - {partial_words}")
# 重置文本框
def reset_textbox():
return gr.update(value='')
# 将组件设置为 visible=False
def set_visible_false():
return gr.update(visible=False)
# 将组件设置为 visible=True
def set_visible_true():
return gr.update(visible=True)
title = """<h1 align="center">🔥 使用 Chat-Completions API 和 🚀 Gradio-Streaming 的 ChatGPT</h1>"""
theme_addon_msg = """<center>🌟 这个演示还向你介绍了 Gradio 主题。在 Gradio 网站上查看我们的 <a href="https://gradio.app/theming-guide/" target="_blank">主题指南🎨</a>来了解更多吧!你可以从头开始开发,用 <code>theme.push_to_hub()</code> 修改现有的 Gradio 主题,并简单地上传到 huggingface-hub 来与社区分享你的主题。</center>
"""
# 使用信息添加有关 ChatGPT 系统消息的其他信息
system_msg_info = """对话可以从系统消息开始,以轻松地指导助手的行为。
系统消息有助于设置 AI 助手的行为。例如,可以用 '你是一个有帮助的助手。' 来指示助手。"""
# 修改现有的 Gradio 主题
theme = gr.themes.Soft(primary_hue="zinc", secondary_hue="purple", neutral_hue="purple",
text_size=gr.themes.sizes.text_lg)
with gr.Blocks(css = """#col_container { margin-left: auto; margin-right: auto;} #chatbot {height: 520px; overflow: auto;}""",
theme=theme) as demo:
gr.HTML(title)
gr.HTML("""<h3 align="center">🔥 这个 Huggingface Gradio 演示为你提供了使用 ChatGPT API 的访问权限,还支持系统消息。请注意,你需要提供 OPENAI API 密钥以访问 ChatGPT 🙌</h1>""")
gr.HTML(theme_addon_msg)
gr.HTML('''<center><a href="https://huggingface.co/spaces/Hmjz100/ChatGPT4?duplicate=true"><img src="https://img.shields.io/badge/-%E5%A4%8D%E5%88%B6%E7%A9%BA%E9%97%B4-blue?labelColor=white&style=flat&logo=&logoWidth=14" alt="复制空间"></a>复制这个空间并使用你的 OpenAI API 密钥安全运行</center>''')
with gr.Column(elem_id = "col_container"):
# 用户需要提供自己的 ChatGPT API 密钥,不再由 Huggingface 提供
with gr.Row():
with gr.Accordion(label="OpenAI API 密钥", open=False):
openai_gptapi_key = gr.Textbox(
label="API 密钥",
type="password",
placeholder="pk-this-is-a-real-free-pool-token-for-everyone",
info="您可以提供自己的 OpenAI ChatGPT API 密钥,或者使用自带的密钥",
)
with gr.Accordion(label="系统消息", open=False):
system_msg = gr.Textbox(label="指示 AI 助手设置其行为", info=system_msg_info, value="", placeholder="在这里输入..")
accordion_msg = gr.HTML(value="🚧 要修改系统消息,你必须刷新页面", visible=False)
chatbot = gr.Chatbot(label='ChatGPT', elem_id="chatbot")
inputs = gr.Textbox(placeholder="嗨!", label="输入文本并按 Enter 键")
state = gr.State([])
with gr.Row():
with gr.Column(scale=7):
b1 = gr.Button().style(full_width=True)
with gr.Column(scale=3):
server_status_code = gr.Textbox(label="来自 OpenAI 服务器的状态代码", )
# 参数设置
with gr.Accordion("高级参数", open=False):
model_max_tokens = {
"gpt-4": 8192,
"gpt-4-32k": 32768,
"gpt-3.5-turbo": 4096,
"gpt-3.5-turbo-16k": 16384,
}
max_tokens = gr.Slider(
minimum=-0,
maximum=model_max_tokens["gpt-4-32k"], # 设置初始最大值
value=4000,
step=1,
interactive=True,
label="最大 Token",
info="助手生成一条信息可以包含的最大 token 数。最大 token 数也受到模型的总长度限制,上文的 token 数和生成的 token 数之和不能超过模型的 token 总数。(默认: 4000)",
)
def update_max_tokens(model_name):
max_tokens.change(maximum = model_max_tokens[model_name])
model = gr.Radio(
["gpt-4", "gpt-4-32k", "gpt-3.5-turbo", "gpt-3.5-turbo-16k"],
value="gpt-4",
label="模型",
info="生成文本所使用的模型,“32k”以及“16k”所指的是模型支持生成的最大Token。(默认: gpt-4)",
update=update_max_tokens,
)
top_p = gr.Slider(
minimum=-0, maximum=1.0, value=1.0, step=0.05,
interactive=True,
label="Top-p (核心采样)",
info="数值在 0 到 1 之间。采用核采样(nucleus sampling)的一种采样温度的替代方法,模型仅考虑前 Top-p 概率质量的 token。因此,0.1 表示仅考虑前 10% 概率质量的 token。我们通常建议修改此参数或采样温度,但不要同时修改两者。(默认: 1)",
)
temperature = gr.Slider(
minimum=-0, maximum=5.0, value=1.0, step=0.1,
interactive=True,
label="采样温度",
info="使用何种采样温度,值在 0 到 2 之间。较高的数值如 0.8 会使输出更加随机,而较低的数值如 0.2 会使输出更加集中和确定。我们通常建议修改此参数或 Top-p,但不要同时修改两者。(默认: 1)",
)
presence_penalty = gr.Slider(
minimum=-2.0, maximum=2.0, value=0, step=0.1,
interactive=True,
label="存在惩罚",
info="数值在 -2.0 到 2.0 之间。正值会根据新 token 是否已经出现在文本中来惩罚它们,增加模型谈论新话题的可能性,以降低生成的回复中出现不常见 token 的频率。(默认: 0)",
)
frequency_penalty = gr.Slider(
minimum=-2.0, maximum=2.0, value=0, step=0.1,
interactive=True,
label="频率惩罚",
info="数值在 -2.0 到 2.0 之间。正值会根据新 token 在文本中的现有频率来惩罚它们,降低模型直接重复相同语句的可能性,以降低生成的回复中重复 token 的频率。(默认: 0)",
)
chat_counter = gr.Number(value=0, visible=False, precision=0)
# 事件处理
inputs.submit(predict, [openai_gptapi_key, model, system_msg, inputs, top_p, temperature, max_tokens, presence_penalty, frequency_penalty, chat_counter, chatbot, state], [chatbot, state, chat_counter, server_status_code],) # openai_api_key
b1.click(predict, [openai_gptapi_key, model, system_msg, inputs, top_p, temperature, max_tokens, presence_penalty, frequency_penalty, chat_counter, chatbot, state], [chatbot, state, chat_counter, server_status_code],) # openai_api_key
inputs.submit(set_visible_false, [], [system_msg])
b1.click(set_visible_false, [], [system_msg])
inputs.submit(set_visible_true, [], [accordion_msg])
b1.click(set_visible_true, [], [accordion_msg])
b1.click(reset_textbox, [], [inputs])
inputs.submit(reset_textbox, [], [inputs])
# 示例
with gr.Accordion(label="系统消息示例:", open=False):
gr.Examples(
examples = [
["""你是一个叫做 ChatGPT 的 AI 助手。
- 仔细并准确地遵循用户的要求。
- 先逐步思考 - 详细描述你在伪代码中要构建的计划。
- 然后将代码以单个代码块的形式输出。
- 尽少说无聊的闲话。"""],
["你是一位幽默的助手,名叫 ComedianGPT。你的回答都带有笑话和机智的回复。"],
["你是 ChefGPT,一位乐于助人的助手,用烹饪专业知识和一点点幽默来回答问题。"],
["你是 FitnessGuruGPT,一位健身专家,以轻松的方式分享锻炼技巧和动力。"],
["你是 SciFiGPT,一位科幻话题的 AI 助手,以知识和机智的方式讨论科幻话题。"],
["你是 PhilosopherGPT,一位深思熟虑的助手,以哲学的见解和一点点幽默来回应问题。"],
["你是 EcoWarriorGPT,一位乐于助人的助手,以轻松的方式分享环保建议。"],
["你是 MusicMaestroGPT,一位知识渊博的 AI,以事实和俏皮的玩笑讨论音乐和其历史。"],
["你是 SportsFanGPT,一位兴致勃勃的助手,谈论体育并分享有趣的轶事。"],
["你是 TechWhizGPT,一位精通科技的 AI,可以帮助用户解决问题并回答与设备和软件相关的问题。"],
["你是 FashionistaGPT,一位时尚专家 AI,以幽默的方式分享时尚建议和潮流趋势。"],
["你是 ArtConnoisseurGPT,一位 AI 助手,以知识和俏皮的评论讨论艺术及其历史。"],
["你是一位提供详细准确信息的乐于助人的助手。"],
["你是一位讲莎士比亚语言的助手。"],
["你是一位友好的助手,使用非正式的语言和幽默。"],
["你是一位金融顾问,为投资和预算提供专业建议。"],
["你是一位健康和健身专家,提供营养和锻炼建议。"],
["你是一位旅行顾问,为目的地、住宿和景点提供建议。"],
["你是一位电影评论家,分享有关电影和其主题的深刻见解。"],
["你是一位热爱历史的助手,喜欢讨论历史事件和人物。"],
["你是一位精通科技的助手,可以帮助用户解决有关设备和软件的问题。"],
["你是一位能够在任何给定主题上创作富有创意和感染力的诗歌的 AI 诗人。"],
],
inputs = system_msg,)
demo.queue(max_size=99, concurrency_count=20).launch(debug=True) |