fietje-2b

Running on Zero

BramVanroy commited on Jan 25

Commit

a34b903

•

1 Parent(s): 70b3775

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -15,7 +15,7 @@ MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "8192"))
 if torch.cuda.is_available():
     model_id = "BramVanroy/GEITje-ultra"
-    model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float16, device_map="auto")
     tokenizer = AutoTokenizer.from_pretrained(model_id)
@@ -80,14 +80,14 @@ chat_interface = gr.ChatInterface(
             minimum=0.05,
             maximum=2,
             step=0.05,
-            value=0.2,
         ),
         gr.Slider(
             label="Top-p (nucleus sampling)",
             minimum=0.05,
             maximum=1.0,
             step=0.05,
-            value=0.9,
         ),
         gr.Slider(
             label="Top-k",

 if torch.cuda.is_available():
     model_id = "BramVanroy/GEITje-ultra"
+    model = AutoModelForCausalLM.from_pretrained(model_id, load_in_8bit=True, device_map="auto")
     tokenizer = AutoTokenizer.from_pretrained(model_id)
             minimum=0.05,
             maximum=2,
             step=0.05,
+            value=1.0,
         ),
         gr.Slider(
             label="Top-p (nucleus sampling)",
             minimum=0.05,
             maximum=1.0,
             step=0.05,
+            value=1.0,
         ),
         gr.Slider(
             label="Top-k",