Spaces:

SiraH
/

DQA-Llama2-4bit

Sleeping

App Files Files Community

SiraH commited on Oct 18, 2023

Commit

6263ce1

•

1 Parent(s): addae57

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -9

app.py CHANGED Viewed

@@ -160,8 +160,8 @@ class UploadDoc:
         return documents
-def split_docs(documents,chunk_size=500):
-    text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=100)
     sp_docs = text_splitter.split_documents(documents)
     return sp_docs
@@ -169,14 +169,14 @@ def split_docs(documents,chunk_size=500):
 def load_llama2_llamaCpp():
     core_model_name = "llama-2-7b-chat.Q4_0.gguf"
     #n_gpu_layers = 32
-    n_batch = 32
     callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])
     llm = LlamaCpp(
         model_path=core_model_name,
         #n_gpu_layers=n_gpu_layers,
         n_batch=n_batch,
         callback_manager=callback_manager,
-        verbose=True,n_ctx = 1024, temperature = 0.1, max_tokens = 256
     )
     return llm
@@ -281,7 +281,7 @@ def main():
         response = qa_chain({'query': query})
-        # url_list = set([i.metadata['source']  for i in response['source_documents']])
         #print(f"condensed quesion : {question_generator.run({'chat_history': response['chat_history'], 'question' : query})}")
         with st.chat_message("assistant"):
@@ -294,10 +294,10 @@ def main():
         # Add assistant response to chat history
         st.session_state.messages.append({"role": "assistant", "content": response['result']})
-        # with st.expander("See the related documents"):
-        #     for count, url in enumerate(url_list):
-        #         #url_reg = regex_source(url)
-        #         st.write(str(count+1)+":", url)
     clear_button = st.button("Start new convo")
     if clear_button :

         return documents
+def split_docs(documents,chunk_size=1000):
+    text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=200)
     sp_docs = text_splitter.split_documents(documents)
     return sp_docs
 def load_llama2_llamaCpp():
     core_model_name = "llama-2-7b-chat.Q4_0.gguf"
     #n_gpu_layers = 32
+    n_batch = 512
     callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])
     llm = LlamaCpp(
         model_path=core_model_name,
         #n_gpu_layers=n_gpu_layers,
         n_batch=n_batch,
         callback_manager=callback_manager,
+        verbose=True,n_ctx = 4096, temperature = 0.1, max_tokens = 512
     )
     return llm
         response = qa_chain({'query': query})
+        #url_list = set([i.metadata['page']  for i in response['source_documents']])
         #print(f"condensed quesion : {question_generator.run({'chat_history': response['chat_history'], 'question' : query})}")
         with st.chat_message("assistant"):
         # Add assistant response to chat history
         st.session_state.messages.append({"role": "assistant", "content": response['result']})
+        with st.expander("See the related documents"):
+            for count, url in enumerate(response['source_documents']):
+                #url_reg = regex_source(url)
+                st.write(str(count+1)+":", url)
     clear_button = st.button("Start new convo")
     if clear_button :