Spaces:

spark-ds549
/

LibRAG

Running

Daniel Foley commited on Dec 11, 2024

Commit

07f86c6

1 Parent(s): 1d172f1

moved length checking upstream to retrieval

Files changed (1) hide show

RAG.py CHANGED Viewed

@@ -70,6 +70,9 @@ def retrieve(query: str,vectorstore:PineconeVectorStore, k: int = 1000) -> Tuple
     documents = []
     scores = []
     for res, score in results:
         documents.append(res)
         scores.append(score)
     logging.info(f"Finished Retrieval: {time.time() - start}")
@@ -233,9 +236,6 @@ def RAG(llm: Any, query: str,vectorstore:PineconeVectorStore, top: int = 10, k:
         # Generate response
         ans_prompt = answer_template.invoke({"context": context, "query": query})
-        # Max input tokens is 10,000 for 4o-mini. This is a quick and dirty solution
-        if len(ans_prompt) > 30000:
-            ans_prompt = ans_prompt[:30000]
         response = llm.invoke(ans_prompt)
         # Parse and return response

     documents = []
     scores = []
     for res, score in results:
+        # check to make sure response isnt too long for context window of 4o-mini
+        if len(res.page_content) > 4000:
+            res.page_content = res.page_content[:4000]
         documents.append(res)
         scores.append(score)
     logging.info(f"Finished Retrieval: {time.time() - start}")
         # Generate response
         ans_prompt = answer_template.invoke({"context": context, "query": query})
         response = llm.invoke(ans_prompt)
         # Parse and return response