Spaces:

brdemorin
/

Phi3_80_steps_v2b

Runtime error

brdemorin commited on May 28

Commit

718d5d1

•

1 Parent(s): 5212cf3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,7 +3,15 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 model_name = "brdemorin/Phi3_80_steps_v2"
-model = AutoModelForCausalLM.from_pretrained(model_name)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 def chat(input_text):

 model_name = "brdemorin/Phi3_80_steps_v2"
+# Update the following parameters as necessary for your GPTQ model
+gptq_parameters = {
+    "load_in_8bit": False,
+    "device_map": "auto",
+    "trust_remote_code": True,  # This is often needed for custom models
+}
+# Load the model with GPTQ parameters
+model = AutoModelForCausalLM.from_pretrained(model_name, **gptq_parameters)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 def chat(input_text):