Spaces:

vilarin
/

LLaMAX3-Translator

Running on Zero

vilarin commited on Aug 5, 2024

Commit

2426b1b

verified ·

1 Parent(s): e668913

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import torch
 import gradio as gr
 import spaces
-from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 import os
 import re
 from polyglot.detect import Detector
@@ -12,13 +12,11 @@ RELATIVE_MODEL="LLaMAX/LLaMAX3-8B"
 TITLE = "<h1><center>LLaMAX3-Translator</center></h1>"
-quantization_config = BitsAndBytesConfig(load_in_8bit=True)
 model = AutoModelForCausalLM.from_pretrained(
         MODEL,
         torch_dtype=torch.float16,
-        device_map="auto",
-        quantization_config=quantization_config)
 tokenizer = AutoTokenizer.from_pretrained(MODEL)

 import torch
 import gradio as gr
 import spaces
+from transformers import AutoModelForCausalLM, AutoTokenizer
 import os
 import re
 from polyglot.detect import Detector
 TITLE = "<h1><center>LLaMAX3-Translator</center></h1>"
 model = AutoModelForCausalLM.from_pretrained(
         MODEL,
         torch_dtype=torch.float16,
+        device_map="auto")
 tokenizer = AutoTokenizer.from_pretrained(MODEL)