Spaces:

wedo2910
/

QA_arabic

Sleeping

App Files Files Community

QA_arabic / app.py

wedo2910

Update app.py

52c3a3a verified about 2 months ago

raw

history blame

2.32 kB

	import streamlit as st
	from transformers import AutoTokenizer, AutoModelForCausalLM

	# Load the new model and tokenizer
	model_name = "wedo2910/research_ai"
	tokenizer_name = "wedo2910/research_ai_tok"

	tokenizer = AutoTokenizer.from_pretrained(tokenizer_name)
	model = AutoModelForCausalLM.from_pretrained(model_name)

	# Define the custom inference function
	def single_inference(question, max_new_tokens, temperature):
	# Prepare the prompt messages
	messages = [
	{"role": "system", "content": "اجب علي الاتي بالعربي فقط."},
	{"role": "user", "content": question},
	]

	# Use the tokenizer's chat template functionality
	input_ids = tokenizer.apply_chat_template(
	messages,
	add_generation_prompt=True,
	return_tensors="pt"
	).to(model.device)

	# Define terminator tokens (end-of-sequence markers)
	terminators = [
	tokenizer.eos_token_id,
	tokenizer.convert_tokens_to_ids("<\|eot_id\|>")
	]

	# Generate the output
	outputs = model.generate(
	input_ids,
	max_new_tokens=max_new_tokens,
	eos_token_id=terminators,
	do_sample=True,
	temperature=temperature,
	)

	# Decode only the newly generated tokens (i.e. skip the prompt)
	response = outputs[0][input_ids.shape[-1]:]
	output = tokenizer.decode(response, skip_special_tokens=True)
	return output

	# Streamlit UI
	st.title("Arabic AI Research QA")
	st.subheader("Ask a question to get an answer from the research AI model.")

	# Input field for the question
	question = st.text_input("Question", placeholder="Enter your question here...")

	# Settings sliders for generation parameters
	st.subheader("Settings")
	max_new_tokens = st.number_input("Max New Tokens", min_value=1, max_value=1000, value=256)
	temperature = st.slider("Temperature", min_value=0.0, max_value=1.0, value=0.4, step=0.1)

	# Generate Answer button
	if st.button("Get Answer"):
	if not question:
	st.error("The question field is required.")
	else:
	try:
	answer = single_inference(question, max_new_tokens, temperature)
	st.subheader("Result")
	st.write(f"Question: {question}")
	st.write(f"Answer: {answer}")
	except Exception as e:
	st.error(f"Error: {e}")