Vintern-1B-v3_5-Demo

Running on Zero

baohuynhbk14 commited on Jan 15

Commit

412554a

1 Parent(s): 1993f10

Install flash-attn package and set default device to CUDA in app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -29,6 +29,11 @@ import traceback
 # import torch
 from conversation import Conversation
 from transformers import AutoModel, AutoTokenizer, TextIteratorStreamer
 logger = build_logger("gradio_web_server", "gradio_web_server.log")

 # import torch
 from conversation import Conversation
 from transformers import AutoModel, AutoTokenizer, TextIteratorStreamer
+import subprocess
+subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
+torch.set_default_device('cuda')
 logger = build_logger("gradio_web_server", "gradio_web_server.log")