Spaces:

nroggendorff
/

dolphin

Paused

nroggendorff commited on Oct 31, 2024

Commit

6196dea

verified ·

1 Parent(s): c4a8e34

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,8 +1,9 @@
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 import torch
-torch.set_default_device("cuda")
 bnb_config = BitsAndBytesConfig(
     load_in_4bit=True,
@@ -11,11 +12,12 @@ bnb_config = BitsAndBytesConfig(
     bnb_4bit_compute_dtype=torch.bfloat16
 )
-model_id = "cognitivecomputations/dolphin-2.9.3-mistral-7B-32k"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_config)
 def predict(input_text, history):
     chat = []
     for item in history:
@@ -26,7 +28,7 @@ def predict(input_text, history):
     conv = tokenizer.apply_chat_template(chat, tokenize=False)
     inputs = tokenizer(conv, return_tensors="pt").to("cuda")
-    outputs = model.generate(**inputs, max_new_tokens=512)
     generated_text = tokenizer.batch_decode(outputs, skip_special_tokens=True)[0]
     return generated_text.split("<|assistant|>")[-1]

 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 import torch
+from spaces import GPU
+GPU = lambda: GPU(duration=70)
 bnb_config = BitsAndBytesConfig(
     load_in_4bit=True,
     bnb_4bit_compute_dtype=torch.bfloat16
 )
+model_id = "cognitivecomputations/dolphin-2.5-mixtral-8x7b"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_config)
+@GPU
 def predict(input_text, history):
     chat = []
     for item in history:
     conv = tokenizer.apply_chat_template(chat, tokenize=False)
     inputs = tokenizer(conv, return_tensors="pt").to("cuda")
+    outputs = model.generate(**inputs, max_new_tokens=2048)
     generated_text = tokenizer.batch_decode(outputs, skip_special_tokens=True)[0]
     return generated_text.split("<|assistant|>")[-1]