tcml-chatglm-chat

Sleeping

Heng666 commited on Jan 17

Commit

0f19430

•

1 Parent(s): 1352af6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,14 +1,15 @@
 import gradio as gr
 import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer
 from transformers import StoppingCriteria, StoppingCriteriaList, TextIteratorStreamer
 from threading import Thread
 # Loading the tokenizer and model from Hugging Face's model hub.
-# model_name = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
-model_name = "scutcyr/BianQue-2"
-tokenizer = AutoTokenizer.from_pretrained(model_name,trust_remote_code=True)
-model = AutoModelForCausalLM.from_pretrained(model_name,trust_remote_code=True)
 # using CUDA for an optimal experience
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

 import gradio as gr
 import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer, AutoModel
 from transformers import StoppingCriteria, StoppingCriteriaList, TextIteratorStreamer
 from threading import Thread
 # Loading the tokenizer and model from Hugging Face's model hub.
+# model_name_or_path = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
+model_name_or_path = "scutcyr/BianQue-2"
+tokenizer = AutoTokenizer.from_pretrained(model_name_or_path,trust_remote_code=True)
+# model = AutoModelForCausalLM.from_pretrained(model_name,trust_remote_code=True)
+model = AutoModel.from_pretrained(model_name_or_path, trust_remote_code=True).half()
 # using CUDA for an optimal experience
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')