Spaces:

SiraH
/

DQA-Llama2-4bit

Sleeping

SiraH commited on Oct 3, 2023

Commit

6176e99

•

1 Parent(s): c5cdf35

Change to gguf format model

Files changed (1) hide show

app.py CHANGED Viewed

@@ -156,7 +156,7 @@ def split_docs(documents,chunk_size=500):
 @st.cache_resource
 def load_llama2_llamaCpp():
-    core_model_name = "llama-2-7b-chat.ggmlv3.q4_0.bin"
     n_gpu_layers = 32
     n_batch = 512
     callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])

 @st.cache_resource
 def load_llama2_llamaCpp():
+    core_model_name = "llama-2-7b-chat.Q4_0.gguf"
     n_gpu_layers = 32
     n_batch = 512
     callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])