Spaces:

dammy
/

chatPDF

Runtime error

dammy commited on Nov 17, 2023

Commit

93544b0

1 Parent(s): a969a6a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -45,31 +45,29 @@ def local_query(query, context):
 def run_query(btn, history, query):
-    # file_name = btn.name
-    # loader = PDFMinerLoader(file_name)
-    # doc = loader.load()
-    # text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
-    # texts = text_splitter.split_documents(doc)
-    # texts = [i.page_content for i in texts]
-    # doc_emb = st_model.encode(texts)
-    # doc_emb = doc_emb.tolist()
-    # ids = [str(uuid.uuid1()) for _ in doc_emb]
-    # client = chromadb.Client()
-    # collection = client.create_collection("test_db")
-    # collection.add(
-    #     embeddings=doc_emb,
-    #     documents=texts,
-    #     ids=ids
-    # )

 def run_query(btn, history, query):
+    file_name = btn.name
+    loader = PDFMinerLoader(file_name)
+    doc = loader.load()
+    text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
+    texts = text_splitter.split_documents(doc)
+    texts = [i.page_content for i in texts]
+    doc_emb = st_model.encode(texts)
+    doc_emb = doc_emb.tolist()
+    ids = [str(uuid.uuid1()) for _ in doc_emb]
+    client = chromadb.Client()
+    collection = client.create_collection("test_db")
+    collection.add(
+        embeddings=doc_emb,
+        documents=texts,
+        ids=ids
+    )