Spaces:

khaled123
/

test23

Runtime error

khaled123 commited on Jun 6, 2024

Commit

ff8ef9c

verified ·

1 Parent(s): 7ec7399

Create app.py

Files changed (1) hide show

app.py ADDED Viewed

+import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
+# Load your quantized model
+model_name = "khaled123/hf"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)
+def chat(input_text):
+    inputs = tokenizer(input_text, return_tensors="pt")
+    outputs = model.generate(inputs["input_ids"], max_length=150, num_return_sequences=1)
+    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return response
+iface = gr.Interface(fn=chat,
+                     inputs="text",
+                     outputs="text",
+                     title="Chatbot",
+                     description="A chatbot using a quantized model")
+iface.launch()