Spaces:

AlekseyKorshuk
/

model-evaluation

Runtime error

App Files Files Community

AlekseyKorshuk commited on May 9, 2023

Commit

cb80e0b

1 Parent(s): fb9f0a9

updates

Browse files

Files changed (8) hide show

app.py +22 -64
conversation.py +2 -0
models/base.py +8 -8
models/chatml.py +0 -2
requirements.txt +3 -1
tabs/arena_battle.py +250 -0
tabs/arena_side_by_side.py +231 -0
tabs/playground.py +115 -0

app.py CHANGED Viewed

@@ -7,13 +7,29 @@ from conversation import Conversation
 from models.base import BaseModel
 import json
 from models.chatml import ChatML
 HUGGINGFACE_TOKEN = os.environ.get("HUGGINGFACE_TOKEN")
 FIREBASE_URL = os.environ.get("FIREBASE_URL")
 CERTIFICATE = json.loads(os.environ.get("CERTIFICATE"))
 API_BASE_PATH = str(os.environ.get("API_BASE_PATH")).replace("\{\}", "{}")
 models = [
     BaseModel(
         name="mosaicml/mpt-7b",
@@ -78,7 +94,7 @@ models = [
         generation_params={
             'temperature': 0.72,
             'repetition_penalty': 1.0,
-            'max_new_tokens': 128,
             'top_k': 10,
             'top_p': 0.9,
             'do_sample': True,
@@ -158,68 +174,10 @@ def get_bot_profile(bot_config):
 with gr.Blocks() as demo:
     with gr.Tabs():
         with gr.TabItem("Playground"):
-            default_bot_id = "_bot_e21de304-6151-4a04-b025-4c553ae8cbca"
-            bot_config = download_bot_config(default_bot_id)
-            user_state = gr.State(
-                bot_config
-            )
-            with gr.Row():
-                bot_id = gr.Textbox(label="Chai bot ID", value=default_bot_id, interactive=True)
-                reload_bot_button = gr.Button("Reload bot")
-            bot_profile = gr.HTML(get_bot_profile(bot_config))
-            first_message = (None, bot_config["firstMessage"])
-            chatbot = gr.Chatbot([first_message])
-            msg = gr.Textbox(label="Message", value="Hi there!")
-            with gr.Row():
-                send = gr.Button("Send")
-                regenerate = gr.Button("Regenerate")
-                clear = gr.Button("Clear")
-            values = list(model_mapping.keys())
-            model_tag = gr.Dropdown(values, value=values[0], label="Model version")
-            def respond(message, chat_history, user_state, model_tag):
-                conv = Conversation(user_state)
-                conv.set_chat_history(chat_history)
-                conv.add_user_message(message)
-                model = model_mapping[model_tag]
-                bot_message = model.generate_response(conv)
-                chat_history.append(
-                    (message, bot_message)
-                )
-                return "", chat_history
-            def clear_chat(chat_history, user_state):
-                chat_history = [(None, user_state["firstMessage"])]
-                return "", chat_history
-            def regenerate_response(chat_history, user_state, model_tag):
-                last_row = chat_history.pop(-1)
-                chat_history.append((last_row[0], None))
-                model = model_mapping[model_tag]
-                conv = Conversation(user_state)
-                conv.set_chat_history(chat_history)
-                bot_message = model.generate_response(conv)
-                chat_history[-1] = (last_row[0], bot_message)
-                return "", chat_history
-            def reload_bot(bot_id, bot_profile, chat_history):
-                bot_config = download_bot_config(bot_id)
-                bot_profile = get_bot_profile(bot_config)
-                return bot_profile, [(None, bot_config["firstMessage"])], bot_config
-            send.click(respond, [msg, chatbot, user_state, model_tag], [msg, chatbot], queue=False)
-            msg.submit(respond, [msg, chatbot, user_state, model_tag], [msg, chatbot], queue=False)
-            clear.click(clear_chat, [chatbot, user_state], [msg, chatbot], queue=False)
-            regenerate.click(regenerate_response, [chatbot, user_state, model_tag], [msg, chatbot], queue=False)
-            reload_bot_button.click(reload_bot, [bot_id, bot_profile, chatbot], [bot_profile, chatbot, user_state],
-                                    queue=False)
 demo.launch(enable_queue=False)

 from models.base import BaseModel
 import json
+from tabs.arena_battle import get_tab_arena_battle
+from tabs.arena_side_by_side import get_tab_arena_side_by_side
+from tabs.playground import get_tab_playground
 from models.chatml import ChatML
+import json
+import os
+import gspread
+from oauth2client.service_account import ServiceAccountCredentials
+scope = ["https://spreadsheets.google.com/feeds", 'https://www.googleapis.com/auth/spreadsheets',
+         "https://www.googleapis.com/auth/drive.file", "https://www.googleapis.com/auth/drive"]
+GOOGLE_SHEETS_CERTIFICATE = json.loads(os.environ.get("GOOGLE_SHEETS_CERTIFICATE"))
 HUGGINGFACE_TOKEN = os.environ.get("HUGGINGFACE_TOKEN")
 FIREBASE_URL = os.environ.get("FIREBASE_URL")
 CERTIFICATE = json.loads(os.environ.get("CERTIFICATE"))
 API_BASE_PATH = str(os.environ.get("API_BASE_PATH")).replace("\{\}", "{}")
+creds = ServiceAccountCredentials.from_json_keyfile_dict(GOOGLE_SHEETS_CERTIFICATE, scope)
+client = gspread.authorize(creds)
 models = [
     BaseModel(
         name="mosaicml/mpt-7b",
         generation_params={
             'temperature': 0.72,
             'repetition_penalty': 1.0,
+            'max_new_tokens': 64,
             'top_k': 10,
             'top_p': 0.9,
             'do_sample': True,
 with gr.Blocks() as demo:
     with gr.Tabs():
         with gr.TabItem("Playground"):
+            get_tab_playground(download_bot_config, get_bot_profile, model_mapping)
+        with gr.TabItem("Chatbot Arena (battle)"):
+            get_tab_arena_battle(download_bot_config, get_bot_profile, model_mapping, client)
+        with gr.TabItem("Chatbot Arena (side-by-side)"):
+            get_tab_arena_side_by_side(download_bot_config, get_bot_profile, model_mapping, client)
 demo.launch(enable_queue=False)

conversation.py CHANGED Viewed

@@ -1,4 +1,5 @@
 class Conversation:
     memory: str
     prompt: str
     bot_label: str
@@ -6,6 +7,7 @@ class Conversation:
     messages: list
     def __init__(self, bot_config):
         self.memory = bot_config.get("memory", "")
         self.prompt = bot_config.get("prompt", "")
         self.bot_label = bot_config.get("botLabel", "Character")

 class Conversation:
+    bot_id: str
     memory: str
     prompt: str
     bot_label: str
     messages: list
     def __init__(self, bot_config):
+        self.bot_id = bot_config.get("bot_id")
         self.memory = bot_config.get("memory", "")
         self.prompt = bot_config.get("prompt", "")
         self.bot_label = bot_config.get("botLabel", "Character")

models/base.py CHANGED Viewed

@@ -16,28 +16,28 @@ class BaseModel:
         self.namespace = namespace
         self.generation_params = generation_params
-    def generate_response(self, conversation):
         prompt = self._get_prompt(conversation)
-        response = self._get_response(prompt)
         return response
     def _get_prompt(self, conversation: Conversation):
-        print(conversation.__dict__)
         prompt = "\n".join(
             [conversation.memory, conversation.prompt]
         ).strip()
         for message in conversation.messages:
             prompt += f"\n{message['from'].strip()}: {message['value'].strip()}"
         prompt += f"\n{conversation.bot_label}:"
-        print(prompt)
         return prompt
-    def _get_response(self, text):
         api = str(os.environ.get("API_BASE_PATH")).replace("\{\}", "{}")
         api = api.format(self.endpoint, self.namespace)
-        payload = {'instances': [text], "parameters": self.generation_params}
         resp = requests.post(api, json=payload, timeout=600)
         assert resp.status_code == 200, (resp.content, resp.status_code)
         return resp.json()["predictions"][0].strip()

         self.namespace = namespace
         self.generation_params = generation_params
+    def generate_response(self, conversation, custom_generation_params=None):
         prompt = self._get_prompt(conversation)
+        response = self._get_response(prompt, custom_generation_params)
         return response
     def _get_prompt(self, conversation: Conversation):
         prompt = "\n".join(
             [conversation.memory, conversation.prompt]
         ).strip()
         for message in conversation.messages:
             prompt += f"\n{message['from'].strip()}: {message['value'].strip()}"
         prompt += f"\n{conversation.bot_label}:"
         return prompt
+    def _get_response(self, text, custom_generation_params):
         api = str(os.environ.get("API_BASE_PATH")).replace("\{\}", "{}")
         api = api.format(self.endpoint, self.namespace)
+        print(api)
+        parameters = self.generation_params
+        if custom_generation_params is not None:
+            parameters.update(custom_generation_params)
+        payload = {'instances': [text], "parameters": parameters}
         resp = requests.post(api, json=payload, timeout=600)
         assert resp.status_code == 200, (resp.content, resp.status_code)
         return resp.json()["predictions"][0].strip()

models/chatml.py CHANGED Viewed

@@ -9,9 +9,7 @@ class ChatML(BaseModel):
             [conversation.memory, conversation.prompt]
         ).strip()
         prompt = f"<|im_start|>system\n{system_message}<|im_end|>"
         for message in conversation.messages:
             prompt += f"\n<|im_start|>{message['from']}\n{message['value']}<|im_end|>"
         prompt += f"\n<|im_start|>{conversation.bot_label}\n"
-        print(prompt)
         return prompt

             [conversation.memory, conversation.prompt]
         ).strip()
         prompt = f"<|im_start|>system\n{system_message}<|im_end|>"
         for message in conversation.messages:
             prompt += f"\n<|im_start|>{message['from']}\n{message['value']}<|im_end|>"
         prompt += f"\n<|im_start|>{conversation.bot_label}\n"
         return prompt

requirements.txt CHANGED Viewed

@@ -1,2 +1,4 @@
 firebase-admin==5.2.0
-gradio

 firebase-admin==5.2.0
+gradio
+gspread
+oauth2client

tabs/arena_battle.py ADDED Viewed

	@@ -0,0 +1,250 @@

+import time
+import gradio as gr
+import random
+from conversation import Conversation
+def get_tab_arena_battle(download_bot_config, get_bot_profile, model_mapping, client):
+    default_bot_id = "_bot_e21de304-6151-4a04-b025-4c553ae8cbca"
+    bot_config = download_bot_config(default_bot_id)
+    user_state = gr.State(
+        bot_config
+    )
+    with gr.Row():
+        bot_id = gr.Textbox(label="Chai bot ID", value=default_bot_id, interactive=True)
+        reload_bot_button = gr.Button("Reload bot")
+    bot_profile = gr.HTML(get_bot_profile(bot_config))
+    with gr.Accordion("Bot config:", open=False):
+        gr.Markdown(f"# Memory\n{bot_config['memory']}\n# Prompt\n{bot_config['prompt']}\n")
+    with gr.Row():
+        values = list(model_mapping.keys())
+        first_message = (None, bot_config["firstMessage"])
+        height = 450
+        model_a_value, model_b_value = random.sample(values, 2)
+        with gr.Column():
+            model_a = gr.Textbox(value=model_a_value, label="Model A", interactive=False, visible=False)
+            chatbot_a = gr.Chatbot([first_message])
+            chatbot_a.style(height=height)
+        with gr.Column():
+            model_b = gr.Textbox(value=model_b_value, label="Model B", interactive=False, visible=False)
+            chatbot_b = gr.Chatbot([first_message])
+            chatbot_b.style(height=height)
+    with gr.Row():
+        with gr.Column(scale=3):
+            msg = gr.Textbox(show_label=False, value="Hi there!", interactive=True)
+        with gr.Column(scale=3):
+            send = gr.Button("Send")
+    with gr.Row():
+        vote_a = gr.Button("👈 A is better", interactive=False)
+        vote_b = gr.Button("👉 B is better", interactive=False)
+        vote_tie = gr.Button("🤝 Tie", interactive=False)
+        vote_bad = gr.Button("💩 Both are bad", interactive=False)
+    show_models_button = gr.Button("Show models", interactive=False)
+    with gr.Row():
+        regenerate = gr.Button("Regenerate", interactive=False)
+        clear = gr.Button("Restart")
+    with gr.Accordion("Generation parameters for model A", open=False):
+        model = model_mapping[model_a.value]
+        temperature_model_a = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["temperature"],
+                                        interactive=True, label="Temperature")
+        repetition_penalty_model_a = gr.Slider(minimum=0.0, maximum=2.0,
+                                               value=model.generation_params["repetition_penalty"],
+                                               interactive=True, label="Repetition penalty")
+        max_new_tokens_model_a = gr.Slider(minimum=1, maximum=512, value=model.generation_params["max_new_tokens"],
+                                           interactive=True, label="Max new tokens")
+        top_k_model_a = gr.Slider(minimum=1, maximum=100, value=model.generation_params["top_k"],
+                                  interactive=True, label="Top-K")
+        top_p_model_a = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["top_p"],
+                                  interactive=True, label="Top-P")
+    with gr.Accordion("Generation parameters for model B", open=False):
+        model = model_mapping[model_b.value]
+        temperature_model_b = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["temperature"],
+                                        interactive=True, label="Temperature")
+        repetition_penalty_model_b = gr.Slider(minimum=0.0, maximum=2.0,
+                                               value=model.generation_params["repetition_penalty"],
+                                               interactive=True, label="Repetition penalty")
+        max_new_tokens_model_b = gr.Slider(minimum=1, maximum=512, value=model.generation_params["max_new_tokens"],
+                                           interactive=True, label="Max new tokens")
+        top_k_model_b = gr.Slider(minimum=1, maximum=100, value=model.generation_params["top_k"],
+                                  interactive=True, label="Top-K")
+        top_p_model_b = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["top_p"],
+                                  interactive=True, label="Top-P")
+    def clear_chat(user_state):
+        return "", [(None, user_state["firstMessage"])], [(None, user_state["firstMessage"])]
+    def reload_bot(bot_id):
+        bot_config = download_bot_config(bot_id)
+        bot_profile = get_bot_profile(bot_config)
+        return bot_profile, [(None, bot_config["firstMessage"])], [(None, bot_config["firstMessage"])], bot_config
+    def get_generation_args(model_tag):
+        model = model_mapping[model_tag]
+        return (
+            model.generation_params["temperature"],
+            model.generation_params["repetition_penalty"],
+            model.generation_params["max_new_tokens"],
+            model.generation_params["top_k"],
+            model.generation_params["top_p"],
+        )
+    def respond(message, chat_history, user_state, model_tag,
+                temperature, repetition_penalty, max_new_tokens, top_k, top_p):
+        custom_generation_params = {
+            'temperature': temperature,
+            'repetition_penalty': repetition_penalty,
+            'max_new_tokens': max_new_tokens,
+            'top_k': top_k,
+            'top_p': top_p,
+        }
+        conv = Conversation(user_state)
+        conv.set_chat_history(chat_history)
+        conv.add_user_message(message)
+        model = model_mapping[model_tag]
+        bot_message = model.generate_response(conv, custom_generation_params)
+        chat_history.append(
+            (message, bot_message)
+        )
+        return "", chat_history
+    def record_vote(user_state, vote,
+                    chat_history_a, model_tag_a,
+                    chat_history_b, model_tag_b):
+        conv_a = Conversation(user_state)
+        conv_a.set_chat_history(chat_history_a)
+        conv_b = Conversation(user_state)
+        conv_b.set_chat_history(chat_history_b)
+        if "A is better" in vote:
+            vote_str = "model_a"
+        elif "B is better" in vote:
+            vote_str = "model_b"
+        elif "Tie" in vote:
+            vote_str = "tie"
+        else:
+            vote_str = "tie (bothbad)"
+        row = {
+            "timestamp": time.time(),
+            "bot_id": user_state["bot_id"],
+            "vote": vote_str,
+            "model_a": model_tag_a,
+            "model_b": model_tag_b,
+            "is_anonymous": int(True)
+        }
+        sheet = client.open("Chat Arena").sheet1
+        num_rows = len(sheet.get_all_records())
+        sheet.insert_row(list(row.values()), index=num_rows + 2)
+        return gr.Button.update(interactive=True)
+    def regenerate_response(chat_history, user_state, model_tag,
+                            temperature, repetition_penalty, max_new_tokens, top_k, top_p):
+        if len(chat_history) == 1:
+            return "", chat_history
+        custom_generation_params = {
+            'temperature': temperature,
+            'repetition_penalty': repetition_penalty,
+            'max_new_tokens': max_new_tokens,
+            'top_k': top_k,
+            'top_p': top_p,
+        }
+        last_row = chat_history.pop(-1)
+        chat_history.append((last_row[0], None))
+        model = model_mapping[model_tag]
+        conv = Conversation(user_state)
+        conv.set_chat_history(chat_history)
+        bot_message = model.generate_response(conv, custom_generation_params)
+        chat_history[-1] = (last_row[0], bot_message)
+        return "", chat_history
+    def disable_voting():
+        return [gr.Button.update(interactive=False)] * 4
+    def enable_voting():
+        return [gr.Button.update(interactive=True)] * 4
+    def show_models():
+        return [gr.Textbox.update(visible=True)] * 2
+    def hide_models():
+        model_a_value, model_b_value = random.sample(values, 2)
+        return [gr.Textbox.update(visible=False, value=model_a_value),
+                gr.Textbox.update(visible=False, value=model_b_value)]
+    def disable_send():
+        return [gr.Button.update(interactive=False)] * 3
+    def enable_send():
+        return [gr.Button.update(interactive=True), gr.Button.update(interactive=False)]
+    def enable_regenerate():
+        return gr.Button.update(interactive=True)
+    for vote in [vote_a, vote_b, vote_tie, vote_bad]:
+        vote.click(record_vote,
+                   [user_state, vote, chatbot_a, model_a, chatbot_b, model_b],
+                   [show_models_button],
+                   queue=False)
+        vote.click(disable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    show_models_button.click(show_models, None, [model_a, model_b], queue=False)
+    clear.click(hide_models, None, [model_a, model_b], queue=False)
+    reload_bot_button.click(hide_models, None, [model_a, model_b], queue=False)
+    show_models_button.click(disable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    show_models_button.click(disable_send, None, [send, regenerate, show_models_button], queue=False)
+    clear.click(enable_send, None, [send, regenerate], queue=False)
+    reload_bot_button.click(enable_send, None, [send, regenerate], queue=False)
+    model_a.change(get_generation_args, [model_a],
+                   [temperature_model_a, repetition_penalty_model_a, max_new_tokens_model_a, top_k_model_a,
+                    top_p_model_a], queue=False)
+    model_b.change(get_generation_args, [model_b],
+                   [temperature_model_b, repetition_penalty_model_b, max_new_tokens_model_b, top_k_model_b,
+                    top_p_model_b], queue=False)
+    clear.click(clear_chat, [user_state], [msg, chatbot_a, chatbot_b], queue=False)
+    model_a.change(clear_chat, [user_state], [msg, chatbot_a, chatbot_b], queue=False)
+    model_b.change(clear_chat, [user_state], [msg, chatbot_a, chatbot_b], queue=False)
+    # model_a.change(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    # model_b.change(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    reload_bot_button.click(disable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    reload_bot_button.click(reload_bot, [bot_id], [bot_profile, chatbot_a, chatbot_b, user_state],
+                            queue=False)
+    send.click(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    clear.click(disable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    regenerate.click(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    msg.submit(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    send.click(respond,
+               [msg, chatbot_a, user_state, model_a, temperature_model_a, repetition_penalty_model_a,
+                max_new_tokens_model_a, top_k_model_a, top_p_model_a], [msg, chatbot_a],
+               queue=False)
+    msg.submit(respond,
+               [msg, chatbot_a, user_state, model_a, temperature_model_a, repetition_penalty_model_a,
+                max_new_tokens_model_a, top_k_model_a, top_p_model_a], [msg, chatbot_a],
+               queue=False)
+    send.click(respond,
+               [msg, chatbot_b, user_state, model_b, temperature_model_b, repetition_penalty_model_b,
+                max_new_tokens_model_b, top_k_model_b, top_p_model_b], [msg, chatbot_b],
+               queue=False)
+    msg.submit(respond,
+               [msg, chatbot_b, user_state, model_b, temperature_model_b, repetition_penalty_model_b,
+                max_new_tokens_model_b, top_k_model_b, top_p_model_b], [msg, chatbot_b],
+               queue=False)
+    send.click(enable_regenerate, None, [regenerate], queue=False)
+    msg.submit(enable_regenerate, None, [regenerate], queue=False)
+    regenerate.click(regenerate_response,
+                     [chatbot_a, user_state, model_a, temperature_model_a, repetition_penalty_model_a,
+                      max_new_tokens_model_a, top_k_model_a,
+                      top_p_model_a], [msg, chatbot_a], queue=False)
+    regenerate.click(regenerate_response,
+                     [chatbot_b, user_state, model_b, temperature_model_b, repetition_penalty_model_b,
+                      max_new_tokens_model_b, top_k_model_b,
+                      top_p_model_b], [msg, chatbot_b], queue=False)

tabs/arena_side_by_side.py ADDED Viewed

	@@ -0,0 +1,231 @@

+import time
+import gradio as gr
+import random
+from conversation import Conversation
+def get_tab_arena_side_by_side(download_bot_config, get_bot_profile, model_mapping, client):
+    default_bot_id = "_bot_e21de304-6151-4a04-b025-4c553ae8cbca"
+    bot_config = download_bot_config(default_bot_id)
+    user_state = gr.State(
+        bot_config
+    )
+    with gr.Row():
+        bot_id = gr.Textbox(label="Chai bot ID", value=default_bot_id, interactive=True)
+        reload_bot_button = gr.Button("Reload bot")
+    bot_profile = gr.HTML(get_bot_profile(bot_config))
+    with gr.Accordion("Bot config:", open=False):
+        gr.Markdown(f"# Memory\n{bot_config['memory']}\n# Prompt\n{bot_config['prompt']}\n")
+    with gr.Row():
+        values = list(model_mapping.keys())
+        first_message = (None, bot_config["firstMessage"])
+        height = 450
+        model_a_value, model_b_value = random.sample(values, 2)
+        with gr.Column():
+            model_a = gr.Dropdown(values, value=model_a_value, label="Model A")
+            chatbot_a = gr.Chatbot([first_message])
+            chatbot_a.style(height=height)
+        with gr.Column():
+            model_b = gr.Dropdown(values, value=model_b_value, label="Model B")
+            chatbot_b = gr.Chatbot([first_message])
+            chatbot_b.style(height=height)
+    with gr.Row():
+        with gr.Column(scale=3):
+            msg = gr.Textbox(show_label=False, value="Hi there!", interactive=True)
+        with gr.Column(scale=3):
+            send = gr.Button("Send")
+    with gr.Row():
+        vote_a = gr.Button("👈 A is better", interactive=False)
+        vote_b = gr.Button("👉 B is better", interactive=False)
+        vote_tie = gr.Button("🤝 Tie", interactive=False)
+        vote_bad = gr.Button("💩 Both are bad", interactive=False)
+    with gr.Row():
+        regenerate = gr.Button("Regenerate", interactive=False)
+        clear = gr.Button("Clear")
+    with gr.Accordion("Generation parameters for model A", open=False):
+        model = model_mapping[model_a.value]
+        temperature_model_a = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["temperature"],
+                                        interactive=True, label="Temperature")
+        repetition_penalty_model_a = gr.Slider(minimum=0.0, maximum=2.0,
+                                               value=model.generation_params["repetition_penalty"],
+                                               interactive=True, label="Repetition penalty")
+        max_new_tokens_model_a = gr.Slider(minimum=1, maximum=512, value=model.generation_params["max_new_tokens"],
+                                           interactive=True, label="Max new tokens")
+        top_k_model_a = gr.Slider(minimum=1, maximum=100, value=model.generation_params["top_k"],
+                                  interactive=True, label="Top-K")
+        top_p_model_a = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["top_p"],
+                                  interactive=True, label="Top-P")
+    with gr.Accordion("Generation parameters for model B", open=False):
+        model = model_mapping[model_b.value]
+        temperature_model_b = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["temperature"],
+                                        interactive=True, label="Temperature")
+        repetition_penalty_model_b = gr.Slider(minimum=0.0, maximum=2.0,
+                                               value=model.generation_params["repetition_penalty"],
+                                               interactive=True, label="Repetition penalty")
+        max_new_tokens_model_b = gr.Slider(minimum=1, maximum=512, value=model.generation_params["max_new_tokens"],
+                                           interactive=True, label="Max new tokens")
+        top_k_model_b = gr.Slider(minimum=1, maximum=100, value=model.generation_params["top_k"],
+                                  interactive=True, label="Top-K")
+        top_p_model_b = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["top_p"],
+                                  interactive=True, label="Top-P")
+    def clear_chat(user_state):
+        return "", [(None, user_state["firstMessage"])], [(None, user_state["firstMessage"])]
+    def reload_bot(bot_id):
+        bot_config = download_bot_config(bot_id)
+        bot_profile = get_bot_profile(bot_config)
+        return bot_profile, [(None, bot_config["firstMessage"])], [(None, bot_config["firstMessage"])], bot_config
+    def get_generation_args(model_tag):
+        model = model_mapping[model_tag]
+        return (
+            model.generation_params["temperature"],
+            model.generation_params["repetition_penalty"],
+            model.generation_params["max_new_tokens"],
+            model.generation_params["top_k"],
+            model.generation_params["top_p"],
+        )
+    def respond(message, chat_history, user_state, model_tag,
+                temperature, repetition_penalty, max_new_tokens, top_k, top_p):
+        custom_generation_params = {
+            'temperature': temperature,
+            'repetition_penalty': repetition_penalty,
+            'max_new_tokens': max_new_tokens,
+            'top_k': top_k,
+            'top_p': top_p,
+        }
+        conv = Conversation(user_state)
+        conv.set_chat_history(chat_history)
+        conv.add_user_message(message)
+        model = model_mapping[model_tag]
+        bot_message = model.generate_response(conv, custom_generation_params)
+        chat_history.append(
+            (message, bot_message)
+        )
+        return "", chat_history
+    def record_vote(user_state, vote,
+                    chat_history_a, model_tag_a,
+                    chat_history_b, model_tag_b):
+        if len(chat_history_a) < 2:
+            return
+        conv_a = Conversation(user_state)
+        conv_a.set_chat_history(chat_history_a)
+        conv_b = Conversation(user_state)
+        conv_b.set_chat_history(chat_history_b)
+        if "A is better" in vote:
+            vote_str = "model_a"
+        elif "B is better" in vote:
+            vote_str = "model_b"
+        elif "Tie" in vote:
+            vote_str = "tie"
+        else:
+            vote_str = "tie (bothbad)"
+        row = {
+            "timestamp": time.time(),
+            "bot_id": user_state["bot_id"],
+            "vote": vote_str,
+            "model_a": model_tag_a,
+            "model_b": model_tag_b,
+            "is_anonymous": int(False)
+        }
+        sheet = client.open("Chat Arena").sheet1
+        num_rows = len(sheet.get_all_records())
+        sheet.insert_row(list(row.values()), index=num_rows + 2)
+        return
+    def regenerate_response(chat_history, user_state, model_tag,
+                            temperature, repetition_penalty, max_new_tokens, top_k, top_p):
+        custom_generation_params = {
+            'temperature': temperature,
+            'repetition_penalty': repetition_penalty,
+            'max_new_tokens': max_new_tokens,
+            'top_k': top_k,
+            'top_p': top_p,
+        }
+        last_row = chat_history.pop(-1)
+        chat_history.append((last_row[0], None))
+        model = model_mapping[model_tag]
+        conv = Conversation(user_state)
+        conv.set_chat_history(chat_history)
+        bot_message = model.generate_response(conv, custom_generation_params)
+        chat_history[-1] = (last_row[0], bot_message)
+        return "", chat_history
+    def disable_voting():
+        return [gr.Button.update(interactive=False)] * 4
+    def enable_voting():
+        return [gr.Button.update(interactive=True)] * 4
+    def enable_send():
+        return [gr.Button.update(interactive=True), gr.Button.update(interactive=False)]
+    def enable_regenerate():
+        return gr.Button.update(interactive=True)
+    for vote in [vote_a, vote_b, vote_tie, vote_bad]:
+        vote.click(record_vote,
+                   [user_state, vote, chatbot_a, model_a, chatbot_b, model_b],
+                   None,
+                   queue=False)
+        vote.click(disable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    model_a.change(get_generation_args, [model_a],
+                   [temperature_model_a, repetition_penalty_model_a, max_new_tokens_model_a, top_k_model_a,
+                    top_p_model_a], queue=False)
+    model_b.change(get_generation_args, [model_b],
+                   [temperature_model_b, repetition_penalty_model_b, max_new_tokens_model_b, top_k_model_b,
+                    top_p_model_b], queue=False)
+    reload_bot_button.click(reload_bot, [bot_id], [bot_profile, chatbot_a, chatbot_b, user_state],
+                            queue=False)
+    clear.click(clear_chat, [user_state], [msg, chatbot_a, chatbot_b], queue=False)
+    model_a.change(clear_chat, [user_state], [msg, chatbot_a, chatbot_b], queue=False)
+    model_b.change(clear_chat, [user_state], [msg, chatbot_a, chatbot_b], queue=False)
+    clear.click(enable_send, None, [send, regenerate], queue=False)
+    reload_bot_button.click(enable_send, None, [send, regenerate], queue=False)
+    model_a.change(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    model_b.change(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    reload_bot_button.click(disable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    send.click(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    clear.click(disable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    regenerate.click(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    msg.submit(enable_voting, None, [vote_a, vote_b, vote_tie, vote_bad], queue=False)
+    send.click(respond,
+               [msg, chatbot_a, user_state, model_a, temperature_model_a, repetition_penalty_model_a,
+                max_new_tokens_model_a, top_k_model_a, top_p_model_a], [msg, chatbot_a],
+               queue=False)
+    msg.submit(respond,
+               [msg, chatbot_a, user_state, model_a, temperature_model_a, repetition_penalty_model_a,
+                max_new_tokens_model_a, top_k_model_a, top_p_model_a], [msg, chatbot_a],
+               queue=False)
+    send.click(respond,
+               [msg, chatbot_b, user_state, model_b, temperature_model_b, repetition_penalty_model_b,
+                max_new_tokens_model_b, top_k_model_b, top_p_model_b], [msg, chatbot_b],
+               queue=False)
+    msg.submit(respond,
+               [msg, chatbot_b, user_state, model_b, temperature_model_b, repetition_penalty_model_b,
+                max_new_tokens_model_b, top_k_model_b, top_p_model_b], [msg, chatbot_b],
+               queue=False)
+    send.click(enable_regenerate, None, [regenerate], queue=False)
+    msg.submit(enable_regenerate, None, [regenerate], queue=False)
+    regenerate.click(regenerate_response,
+                     [chatbot_a, user_state, model_a, temperature_model_a, repetition_penalty_model_a,
+                      max_new_tokens_model_a, top_k_model_a,
+                      top_p_model_a], [msg, chatbot_a], queue=False)
+    regenerate.click(regenerate_response,
+                     [chatbot_b, user_state, model_b, temperature_model_b, repetition_penalty_model_b,
+                      max_new_tokens_model_b, top_k_model_b,
+                      top_p_model_b], [msg, chatbot_b], queue=False)

tabs/playground.py ADDED Viewed

	@@ -0,0 +1,115 @@

+import gradio as gr
+from conversation import Conversation
+def get_tab_playground(download_bot_config, get_bot_profile, model_mapping):
+    default_bot_id = "_bot_e21de304-6151-4a04-b025-4c553ae8cbca"
+    bot_config = download_bot_config(default_bot_id)
+    user_state = gr.State(
+        bot_config
+    )
+    with gr.Row():
+        bot_id = gr.Textbox(label="Chai bot ID", value=default_bot_id, interactive=True)
+        reload_bot_button = gr.Button("Reload bot")
+    bot_profile = gr.HTML(get_bot_profile(bot_config))
+    with gr.Accordion("Bot config:", open=False):
+        gr.Markdown(f"# Memory\n{bot_config['memory']}\n# Prompt\n{bot_config['prompt']}\n")
+    first_message = (None, bot_config["firstMessage"])
+    chatbot = gr.Chatbot([first_message])
+    msg = gr.Textbox(label="Message", value="Hi there!")
+    with gr.Row():
+        send = gr.Button("Send")
+        regenerate = gr.Button("Regenerate")
+        clear = gr.Button("Clear")
+    values = list(model_mapping.keys())
+    model_tag = gr.Dropdown(values, value=values[0], label="Model version")
+    model = model_mapping[model_tag.value]
+    with gr.Accordion("Generation parameters", open=False):
+        temperature = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["temperature"],
+                                interactive=True, label="Temperature")
+        repetition_penalty = gr.Slider(minimum=0.0, maximum=2.0,
+                                       value=model.generation_params["repetition_penalty"],
+                                       interactive=True, label="Repetition penalty")
+        max_new_tokens = gr.Slider(minimum=1, maximum=512, value=model.generation_params["max_new_tokens"],
+                                   interactive=True, label="Max new tokens")
+        top_k = gr.Slider(minimum=1, maximum=100, value=model.generation_params["top_k"],
+                          interactive=True, label="Top-K")
+        top_p = gr.Slider(minimum=0.0, maximum=1.0, value=model.generation_params["top_p"],
+                          interactive=True, label="Top-P")
+    def respond(message, chat_history, user_state, model_tag,
+                temperature, repetition_penalty, max_new_tokens, top_k, top_p):
+        custom_generation_params = {
+            'temperature': temperature,
+            'repetition_penalty': repetition_penalty,
+            'max_new_tokens': max_new_tokens,
+            'top_k': top_k,
+            'top_p': top_p,
+        }
+        conv = Conversation(user_state)
+        conv.set_chat_history(chat_history)
+        conv.add_user_message(message)
+        model = model_mapping[model_tag]
+        bot_message = model.generate_response(conv, custom_generation_params)
+        chat_history.append(
+            (message, bot_message)
+        )
+        return "", chat_history
+    def clear_chat(chat_history, user_state):
+        chat_history = [(None, user_state["firstMessage"])]
+        return chat_history
+    def regenerate_response(chat_history, user_state, model_tag,
+                            temperature, repetition_penalty, max_new_tokens, top_k, top_p):
+        custom_generation_params = {
+            'temperature': temperature,
+            'repetition_penalty': repetition_penalty,
+            'max_new_tokens': max_new_tokens,
+            'top_k': top_k,
+            'top_p': top_p,
+        }
+        last_row = chat_history.pop(-1)
+        chat_history.append((last_row[0], None))
+        model = model_mapping[model_tag]
+        conv = Conversation(user_state)
+        conv.set_chat_history(chat_history)
+        bot_message = model.generate_response(conv, custom_generation_params)
+        chat_history[-1] = (last_row[0], bot_message)
+        return chat_history
+    def reload_bot(bot_id, bot_profile, chat_history):
+        bot_config = download_bot_config(bot_id)
+        bot_profile = get_bot_profile(bot_config)
+        return bot_profile, [(None, bot_config["firstMessage"])], bot_config
+    def get_generation_args(model_tag):
+        model = model_mapping[model_tag]
+        return (
+            model.generation_params["temperature"],
+            model.generation_params["repetition_penalty"],
+            model.generation_params["max_new_tokens"],
+            model.generation_params["top_k"],
+            model.generation_params["top_p"],
+        )
+    model_tag.change(get_generation_args, [model_tag], [temperature, repetition_penalty, max_new_tokens, top_k,
+                                                        top_p], queue=False)
+    send.click(respond,
+               [msg, chatbot, user_state, model_tag, temperature, repetition_penalty, max_new_tokens, top_k,
+                top_p], [msg, chatbot],
+               queue=False)
+    msg.submit(respond,
+               [msg, chatbot, user_state, model_tag, temperature, repetition_penalty, max_new_tokens, top_k,
+                top_p], [msg, chatbot],
+               queue=False)
+    clear.click(clear_chat, [chatbot, user_state], [chatbot], queue=False)
+    regenerate.click(regenerate_response,
+                     [chatbot, user_state, model_tag, temperature, repetition_penalty, max_new_tokens, top_k,
+                      top_p], [chatbot], queue=False)
+    reload_bot_button.click(reload_bot, [bot_id, bot_profile, chatbot], [bot_profile, chatbot, user_state],
+                            queue=False)