RAGDEV

Runtime error

App Files Files Community

alexkueck commited on Feb 16, 2024

Commit

ef399e7

verified ·

1 Parent(s): 1911f86

Update utils.py

Browse files

Files changed (1) hide show

utils.py +49 -7

utils.py CHANGED Viewed

@@ -18,6 +18,7 @@ import time
 import json
 import operator
 from typing import Annotated, Sequence, TypedDict
 import gradio as gr
 from pypinyin import lazy_pinyin
@@ -29,6 +30,7 @@ from pygments.lexers import guess_lexer,get_lexer_by_name
 from pygments.formatters import HtmlFormatter
 from langchain.chains import LLMChain, RetrievalQA
 from langchain.chat_models import ChatOpenAI
 from langchain.document_loaders import PyPDFLoader, WebBaseLoader, UnstructuredWordDocumentLoader, DirectoryLoader
 from langchain.document_loaders.blob_loaders.youtube_audio import YoutubeAudioLoader
@@ -350,13 +352,53 @@ def llm_chain2(llm, prompt):
     return result
 #############################################
 #langchain nutzen, um prompt an llm zu leiten, aber vorher in der VektorDB suchen, um passende splits zum Prompt hinzuzufügen
-def rag_chain(llm, prompt, db):
-    rag_chain = RetrievalQA.from_chain_type(llm,
-                                            chain_type_kwargs = {"prompt": RAG_CHAIN_PROMPT},
-                                            retriever = db.as_retriever(search_kwargs = {"k": 5}),
-                                            return_source_documents = True)
-    result = rag_chain({"query": prompt})
-    return result["result"]
 ############################################
 # rag_chain Alternative für RAg mit Bild-Upload, da hier das llm so nicht genutzt werden kann und der prompt mit den RAG Erweiterungen anders übergeben wird

 import json
 import operator
 from typing import Annotated, Sequence, TypedDict
+import pprint
 import gradio as gr
 from pypinyin import lazy_pinyin
 from pygments.formatters import HtmlFormatter
 from langchain.chains import LLMChain, RetrievalQA
+from langgraph.graph import END, StateGraph
 from langchain.chat_models import ChatOpenAI
 from langchain.document_loaders import PyPDFLoader, WebBaseLoader, UnstructuredWordDocumentLoader, DirectoryLoader
 from langchain.document_loaders.blob_loaders.youtube_audio import YoutubeAudioLoader
     return result
 #############################################
 #langchain nutzen, um prompt an llm zu leiten, aber vorher in der VektorDB suchen, um passende splits zum Prompt hinzuzufügen
+def rag_chain(llm, prompt, vectorstore, retriever):
+    #Langgraph nutzen für ein wenig mehr Intelligenz beim Dokumente suchen
+    workflow = StateGraph(GraphState)
+    # Define the nodes
+    workflow.add_node("retrieve", retrieve)  # retrieve
+    workflow.add_node("grade_documents", grade_documents)  # grade documents
+    workflow.add_node("generate", generate)  # generate
+    workflow.add_node("generate_ohne", generate)  # generate ohne dokumente anzuhängen
+    workflow.add_node("transform_query", transform_query)  # transform_query
+    #momentan  nicht genutzt
+    #workflow.add_node("web_search", web_search)  # web search
+    ###
+    # Fügen Sie einen Zwischenknoten hinzu, um von transform_query zu retrieve zurückzukehren
+    workflow.add_node("retrieve_redirect", retrieve)  # Dies könnte eine Wrapper-Funktion sein, die retrieve aufruft
+    # Build graph
+    workflow.set_entry_point("retrieve")
+    workflow.add_edge("retrieve", "grade_documents")
+    workflow.add_conditional_edges(
+        "grade_documents",
+        decide_to_generate,
+        {
+            "transform_query": "transform_query",
+            "generate_ohne": "generate_ohne",
+            "generate": "generate",
+        },
+    )
+    workflow.add_edge("transform_query", "retrieve_redirect")
+    workflow.add_edge("retrieve_redirect", "retrieve")
+    workflow.add_edge("generate_ohne", "generate")
+    workflow.add_edge("generate", END)
+    # Compile
+    app = workflow.compile()
+    #Dokumente suchen
+    inputs = {"keys": {"question": prompt}}
+    for output in app.stream(inputs):
+        for key, value in output.items():
+            # Node
+            pprint.pprint(f"Node '{key}':")
+            # Optional: print full state at each node
+            # pprint.pprint(value["keys"], indent=2, width=80, depth=None)
+        pprint.pprint("\n---\n")
+    # Final generation
+    pprint.pprint(value['keys']['generation'])
 ############################################
 # rag_chain Alternative für RAg mit Bild-Upload, da hier das llm so nicht genutzt werden kann und der prompt mit den RAG Erweiterungen anders übergeben wird