Hermes-3-Llama-3.2-3B

Running on Zero

vilarin commited on 9 days ago

Commit

bccdc56

•

1 Parent(s): d8a8bf1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -50,6 +50,7 @@ model = AutoModelForCausalLM.from_pretrained(
     MODEL,
     torch_dtype=torch.float16,
     device_map="auto",
     quantization_config=quantization_config)
 # Ensure `pad_token_id` is set

     MODEL,
     torch_dtype=torch.float16,
     device_map="auto",
+    attn_implementation="flash_attention_2",
     quantization_config=quantization_config)
 # Ensure `pad_token_id` is set