BlenderBot-1B-distill

Runtime error

App Files Files Community

BlenderBot-1B-distill / app.py

4eJIoBek

Update app.py

a21e0db almost 2 years ago

raw

history blame

1.92 kB

	import os
	import gradio as gr

	title = "Have Fun With ChubbyBot"
	description = """
	<p>
	<center>
	The bot is trained on blended_skill_talk dataset using facebook/blenderbot-1B-distill.
	<img src="https://huggingface.co/spaces/EXFINITE/BlenderBot-UI/resolve/main/img/cover.png" alt="rick" width="250"/>
	</center>
	</p>
	"""
	article = "<p style='text-align: center'><a href='https://arxiv.org/abs/1907.06616' target='_blank'>Recipes for building an open-domain chatbot</a></p><p style='text-align: center'><a href='https://parl.ai/projects/recipes/' target='_blank'>Original PARLAI Code</a></p></center></p>"

	import torch
	from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, BlenderbotForConditionalGeneration, BlenderbotForCausalLM, BlenderbotTokenizer

	tokenizer = BlenderbotTokenizer.from_pretrained("facebook/blenderbot-1B-distill")
	model = BlenderbotForConditionalGeneration.from_pretrained("facebook/blenderbot-1B-distill",add_cross_attention=False)

	def predict(input, history=[]):
	# tokenize the new input sentence
	new_user_input_ids = tokenizer.encode(input + tokenizer.eos_token, return_tensors='pt')

	# append the new user input tokens to the chat history
	bot_input_ids = torch.cat([torch.LongTensor(history), new_user_input_ids], dim=-1)

	# generate a response
	history = model.generate(bot_input_ids, max_length=1000, pad_token_id=tokenizer.eos_token_id).tolist()

	# convert the tokens to text, and then split the responses into the right format
	response = tokenizer.decode(history[0]).replace("<s>","").split("</s>")
	response = [(response[i], response[i+1]) for i in range(0, len(response), 2)] # convert to tuples of list
	return response, history

	gr.Interface(
	fn = predict,
	inputs = ["textbox","state"],
	outputs = ["chatbot","state"],
	theme ="seafoam",
	title = title,
	description = description,
	article = article
	).launch(enable_queue=True)