Spaces:

gpt-99
/

steering-vectors

Running

gpt-99 commited on Oct 18, 2024

Commit

56399a2

verified ·

1 Parent(s): a52f1d8

Upload 2 files

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,23 +1,17 @@
 import gradio as gr
 import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 from einops import einsum
 from tqdm import tqdm
 device = "cuda" if torch.cuda.is_available() else "cpu"
 model_name = 'microsoft/Phi-3-mini-4k-instruct'
-quantization_config = BitsAndBytesConfig(
-    load_in_4bit=True,
-    bnb_4bit_compute_dtype=torch.float16
-)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     device_map=device,
     torch_dtype="auto",
     trust_remote_code=True,
-    quantization_config=quantization_config,
 )
 tokenizer = AutoTokenizer.from_pretrained(model_name)
@@ -179,4 +173,3 @@ def launch_app():
 if __name__ == "__main__":
     launch_app()

 import gradio as gr
 import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
 from einops import einsum
 from tqdm import tqdm
 device = "cuda" if torch.cuda.is_available() else "cpu"
 model_name = 'microsoft/Phi-3-mini-4k-instruct'
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     device_map=device,
     torch_dtype="auto",
     trust_remote_code=True,
 )
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 if __name__ == "__main__":
     launch_app()

requirements.txt CHANGED Viewed

@@ -10,7 +10,7 @@ appnope==0.1.4
 asttokens==2.4.1
 astunparse==1.6.3
 attrs==24.2.0
-bitsandbytes==0.44.1
 certifi==2024.8.30
 charset-normalizer==3.3.2
 click==8.1.7

 asttokens==2.4.1
 astunparse==1.6.3
 attrs==24.2.0
+bitsandbytes==0.42.0
 certifi==2024.8.30
 charset-normalizer==3.3.2
 click==8.1.7