By clicking the "Start" button above, you consent to the collection and use of your input data for research purposes.

""") all_components += [human_input_textbox, btn_step, btn_restart] def _convert_to_chatbot_output(all_messages, display_recv=False): chatbot_output = [] for i, message in enumerate(all_messages): agent_name, msg, recv = message.agent_name, message.content, str(message.visible_to) new_msg = re.sub(r'\n+', '
', msg.strip()) # Preprocess message for chatbot output if display_recv: new_msg = f"**{agent_name} (-> {recv})**: {new_msg}" # Add role to the message else: new_msg = f"**{agent_name}**: {new_msg}" if agent_name == "Moderator": chatbot_output.append((new_msg, None)) else: chatbot_output.append((None, new_msg)) return chatbot_output def _create_arena_config_from_components(all_comps: dict) -> ArenaConfig: env_desc = all_comps[env_desc_textbox] # Initialize the players num_players = all_comps[num_player_slider] player_configs = [] for i in range(num_players): player_name = f"Player {i + 1}" role_desc, backend_type, temperature, max_tokens = [ all_comps[c] for c in players_idx2comp[i] if not isinstance(c, (gr.Accordion, gr.Tab))] player_config = { "name": player_name, "role_desc": role_desc, "global_prompt": env_desc, "backend": { "backend_type": backend_type, "temperature": temperature, "max_tokens": max_tokens } } player_configs.append(player_config) # Initialize the environment env_type = all_comps[env_selector] # Get moderator config mod_role_desc, mod_terminal_condition, moderator_backend_type, mod_temp, mod_max_tokens = [ all_comps[c] for c in moderator_components if not isinstance(c, (gr.Accordion, gr.Tab))] moderator_config = { "role_desc": mod_role_desc, "global_prompt": env_desc, "terminal_condition": mod_terminal_condition, "backend": { "backend_type": moderator_backend_type, "temperature": mod_temp, "max_tokens": mod_max_tokens } } env_config = { "env_type": env_type, "parallel": all_comps[parallel_checkbox], "moderator": moderator_config, "moderator_visibility": "all", "moderator_period": "turn" } # arena_config = {"players": player_configs, "environment": env_config} arena_config = ArenaConfig(players=player_configs, environment=env_config) return arena_config def step_game(all_comps: dict): yield {btn_step: gr.update(value="Running...", interactive=False), btn_restart: gr.update(interactive=False)} cur_state = all_comps[state] # If arena is not yet created, create it if cur_state["arena"] is None: # Create the Arena arena_config = _create_arena_config_from_components(all_comps) arena = Arena.from_config(arena_config) log_arena(arena, database=DB) cur_state["arena"] = arena else: arena = cur_state["arena"] try: timestep = arena.step() except HumanBackendError as e: # Handle human input and recover with the game update human_input = all_comps[human_input_textbox] if human_input == "": timestep = None # Failed to get human input else: timestep = arena.environment.step(e.agent_name, human_input) except TooManyInvalidActions as e: timestep = arena.current_timestep timestep.observation.append( Message("System", "Too many invalid actions. Game over.", turn=-1, visible_to="all")) timestep.terminal = True if timestep is None: yield {human_input_textbox: gr.update(value="", placeholder="Please enter a valid input"), btn_step: gr.update(value="Next Step", interactive=True), btn_restart: gr.update(interactive=True)} else: all_messages = timestep.observation # user sees what the moderator sees log_messages(arena, all_messages, database=DB) chatbot_output = _convert_to_chatbot_output(all_messages, display_recv=True) update_dict = {human_input_textbox: gr.Textbox.update(value=""), chatbot: chatbot_output, btn_step: gr.update(value="Next Step", interactive=not timestep.terminal), btn_restart: gr.update(interactive=True), state: cur_state} # Get the visible messages for each player for i, player in enumerate(arena.players): player_messages = arena.environment.get_observation(player.name) player_output = _convert_to_chatbot_output(player_messages) # Update the player's chatbot output update_dict[player_chatbots[i]] = player_output if DEBUG: arena.environment.print() yield update_dict def restart_game(all_comps: dict): cur_state = all_comps[state] cur_state["arena"] = None yield {chatbot: [], btn_restart: gr.update(interactive=False), btn_step: gr.update(interactive=False), state: cur_state} arena_config = _create_arena_config_from_components(all_comps) arena = Arena.from_config(arena_config) log_arena(arena, database=DB) cur_state["arena"] = arena yield {btn_step: gr.update(value="Start", interactive=True), btn_restart: gr.update(interactive=True), state: cur_state} # Remove Accordion and Tab from the list of components all_components = [comp for comp in all_components if not isinstance(comp, (gr.Accordion, gr.Tab))] # If any of the Textbox, Slider, Checkbox, Dropdown, RadioButtons is changed, the Step button is disabled for comp in all_components: def _disable_step_button(state): if state["arena"] is not None: return gr.update(interactive=False) else: return gr.update() if isinstance(comp, (gr.Textbox, gr.Slider, gr.Checkbox, gr.Dropdown, gr.Radio)) and comp is not human_input_textbox: comp.change(_disable_step_button, state, btn_step) btn_step.click(step_game, set(all_components + [state]), [chatbot, *player_chatbots, btn_step, btn_restart, state, human_input_textbox]) btn_restart.click(restart_game, set(all_components + [state]), [chatbot, *player_chatbots, btn_step, btn_restart, state, human_input_textbox]) # If an example is selected, update the components def update_components_from_example(all_comps: dict): example_name = all_comps[example_selector] example_config = EXAMPLE_REGISTRY[example_name] update_dict = {} # Update the environment components env_config = example_config['environment'] update_dict[env_desc_textbox] = gr.update(value=example_config['global_prompt']) update_dict[env_selector] = gr.update(value=env_config['env_type']) update_dict[parallel_checkbox] = gr.update(value=env_config['parallel']) # Update the moderator components if "moderator" in env_config: mod_role_desc, mod_terminal_condition, moderator_backend_type, mod_temp, mod_max_tokens = [ c for c in moderator_components if not isinstance(c, (gr.Accordion, gr.Tab)) ] update_dict[mod_role_desc] = gr.update(value=env_config['moderator']['role_desc']) update_dict[mod_terminal_condition] = gr.update(value=env_config['moderator']['terminal_condition']) update_dict[moderator_backend_type] = gr.update(value=env_config['moderator']['backend']['backend_type']) update_dict[mod_temp] = gr.update(value=env_config['moderator']['backend']['temperature']) update_dict[mod_max_tokens] = gr.update(value=env_config['moderator']['backend']['max_tokens']) # Update the player components update_dict[num_player_slider] = gr.update(value=len(example_config['players'])) for i, player_config in enumerate(example_config['players']): role_desc, backend_type, temperature, max_tokens = [ c for c in players_idx2comp[i] if not isinstance(c, (gr.Accordion, gr.Tab)) ] update_dict[role_desc] = gr.update(value=player_config['role_desc']) update_dict[backend_type] = gr.update(value=player_config['backend']['backend_type']) update_dict[temperature] = gr.update(value=player_config['backend']['temperature']) update_dict[max_tokens] = gr.update(value=player_config['backend']['max_tokens']) return update_dict example_selector.change(update_components_from_example, set(all_components + [state]), all_components + [state]) demo.queue(concurrency_count=32) # To improve concurrency demo.launch(debug=DEBUG)