Demo-Llama-Guard-3-1B

Sleeping

schroneko commited on Jul 23

Commit

42e6f8d

•

1 Parent(s): 878b1d0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -15,13 +15,14 @@ dtype = torch.bfloat16
 quantization_config = BitsAndBytesConfig(load_in_8bit=True)
 def load_model():
-    tokenizer = AutoTokenizer.from_pretrained(model_id, use_auth_token=huggingface_token)
     model = AutoModelForCausalLM.from_pretrained(
         model_id,
         torch_dtype=dtype,
-        device_map=device,
         quantization_config=quantization_config,
-        use_auth_token=huggingface_token
     )
     return tokenizer, model

 quantization_config = BitsAndBytesConfig(load_in_8bit=True)
 def load_model():
+    tokenizer = AutoTokenizer.from_pretrained(model_id, token=huggingface_token)
     model = AutoModelForCausalLM.from_pretrained(
         model_id,
         torch_dtype=dtype,
+        device_map="auto",
         quantization_config=quantization_config,
+        token=huggingface_token,
+        low_cpu_mem_usage=True
     )
     return tokenizer, model