Spaces:

emeses
/

lab2

Sleeping

emeses commited on Dec 5, 2024

Commit

2491660

1 Parent(s): 52e2a53

Update space

Files changed (2) hide show

.build_config ADDED Viewed

+# .build_config
+build:
+  cuda: "11.8"
+  python_version: "3.10"
+  system_packages:
+    - "nvidia-cuda-toolkit"

app.py CHANGED Viewed

@@ -3,6 +3,13 @@ from huggingface_hub import InferenceClient
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
 # Load model and tokenizer
 base_model = AutoModelForCausalLM.from_pretrained("unsloth/Llama-3.2-3B-Instruct-bnb-4bit")
 model = PeftModel.from_pretrained(base_model, "emeses/lab2_model")

 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
+device = "cuda" if torch.cuda.is_available() else "cpu"
+base_model = AutoModelForCausalLM.from_pretrained(
+    "unsloth/Llama-3.2-3B-Instruct-bnb-4bit",
+    device_map="auto",
+    torch_dtype=torch.float16
+)
 # Load model and tokenizer
 base_model = AutoModelForCausalLM.from_pretrained("unsloth/Llama-3.2-3B-Instruct-bnb-4bit")
 model = PeftModel.from_pretrained(base_model, "emeses/lab2_model")