Spaces:

matteosz
/

epfl-tutor

Sleeping

matteosz commited on Jun 7, 2024

Commit

206fd23

1 Parent(s): edd396d

revert unquantized

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,15 +1,22 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
-checkpoint = 'matteosz/phi3-mini-4k-sft-dpo-quant'
 tokenizer = AutoTokenizer.from_pretrained(checkpoint, trust_remote_code=True)
 tokenizer.model_max_length = 256
-model = AutoModelForCausalLM.from_pretrained(
     checkpoint,
     trust_remote_code=True,
     device_map='auto',
-).eval()
 pipe = pipeline(
     "text-generation",

 import gradio as gr
+from transformers import AutoTokenizer, pipeline
+from peft import AutoPeftModelForCausalLM
+import torch
+checkpoint = 'ernestoBocini/Phi3-mini-DPO-Tuned'
 tokenizer = AutoTokenizer.from_pretrained(checkpoint, trust_remote_code=True)
 tokenizer.model_max_length = 256
+tokenizer.pad_token = tokenizer.unk_token
+tokenizer.pad_token_id = tokenizer.convert_tokens_to_ids(tokenizer.pad_token)
+tokenizer.padding_side = 'left'
+model = AutoPeftModelForCausalLM.from_pretrained(
     checkpoint,
     trust_remote_code=True,
     device_map='auto',
+    torch_dtype=torch.bfloat16
+).merge_and_unload().to(torch.float16).eval()
 pipe = pipeline(
     "text-generation",