Spaces:

smangrul
/

PEFT-Docs-QA-Chatbot

Running

Sourab Mangrulkar commited on Aug 9, 2023

Commit

7d055fb

1 Parent(s): 6f4afc6

fixes

Files changed (2) hide show

app.py CHANGED Viewed

@@ -3,6 +3,7 @@ import json
 import re
 from sentence_transformers import SentenceTransformer, CrossEncoder
 import hnswlib
 from typing import Iterator
 import gradio as gr
@@ -21,6 +22,7 @@ EMBED_DIM = 1024
 K = 10
 EF = 100
 SEARCH_INDEX = "search_index.bin"
 DOCUMENT_DATASET = "chunked_data.parquet"
 COSINE_THRESHOLD = 0.7
@@ -119,6 +121,19 @@ def load_hnsw_index(index_file):
     return index
 def create_query_embedding(query):
     # Encode the query to get its embedding
     embedding = biencoder.encode([query], normalize_embeddings=True)[0]
@@ -274,7 +289,7 @@ def check_input_token_length(message: str, chat_history: list[tuple[str, str]],
         )
-search_index = load_hnsw_index(SEARCH_INDEX)
 data_df = pd.read_parquet(DOCUMENT_DATASET).reset_index()
 with gr.Blocks(css="style.css") as demo:
     gr.Markdown(DESCRIPTION)
@@ -448,4 +463,4 @@ with gr.Blocks(css="style.css") as demo:
         api_name=False,
     )
-demo.queue(max_size=20).launch(debug=True, share=True)

 import re
 from sentence_transformers import SentenceTransformer, CrossEncoder
 import hnswlib
+import numpy as np
 from typing import Iterator
 import gradio as gr
 K = 10
 EF = 100
 SEARCH_INDEX = "search_index.bin"
+EMBEDDINGS_FILE = "embeddings.npy"
 DOCUMENT_DATASET = "chunked_data.parquet"
 COSINE_THRESHOLD = 0.7
     return index
+# create the index for the PEFT docs from numpy embeddings
+# avoid the arch mismatches when creating search index
+def create_hnsw_index(embeddings_file, M=16, efC=100):
+    embeddings = np.load(embeddings_file)
+    # Create the HNSW index
+    num_dim = embeddings.shape[1]
+    ids = np.arange(embeddings.shape[0])
+    index = hnswlib.Index(space="ip", dim=num_dim)
+    index.init_index(max_elements=embeddings.shape[0], ef_construction=efC, M=M)
+    index.add_items(embeddings, ids)
+    return index
 def create_query_embedding(query):
     # Encode the query to get its embedding
     embedding = biencoder.encode([query], normalize_embeddings=True)[0]
         )
+search_index = create_hnsw_index(EMBEDDINGS_FILE)  # load_hnsw_index(SEARCH_INDEX)
 data_df = pd.read_parquet(DOCUMENT_DATASET).reset_index()
 with gr.Blocks(css="style.css") as demo:
     gr.Markdown(DESCRIPTION)
         api_name=False,
     )
+demo.queue(max_size=20).launch(debug=True, share=False)

search_index.bin → embeddings.npy RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14e38e3cb1c2b2e64977ca2ca5ded4ebff397412e228d6777304626448da8680
-size 4911056

 version https://git-lfs.github.com/spec/v1
+oid sha256:d98d063ffe42060493c8e52bb0c8f0b33f57d6316dd0b27651ebdccad212defa
+size 4735104