RAGDEV

Runtime error

App Files Files Community

alexkueck commited on Feb 17

Commit

7d21d32

•

1 Parent(s): 3ef610a

Update utils.py

Browse files

Files changed (1) hide show

utils.py +2 -370

utils.py CHANGED Viewed

@@ -44,7 +44,7 @@ from langchain_community.tools import DuckDuckGoSearchRun
 from langchain.retrievers.tavily_search_api import TavilySearchAPIRetriever
 from typing import Dict, TypedDict
 from langchain_core.messages import BaseMessage
-from langchain.embeddings.openai import OpenAIEmbeddings
 from langchain.prompts import PromptTemplate
@@ -293,16 +293,6 @@ def grade_documents_direct(prompt, documents):
     # LLM
     model = ChatOpenAI(temperature=0.3, model="gpt-3.5-turbo-1106", streaming=True)
-    """
-    xxx = Du bist ein Bewerter, der die Relevanz von einem erhaltenen Dokument zu einer Nutzeranfrage bewerten soll. \n
-        Hier ist das erhaltene Dokument: \n\n {context} \n\n
-        Hier ist die Nutzeranfrage: {question} \n
-        Wenn das erhaltene Dokument Keywörter oder semantische Bedeutung in Bezug auf die Nutzeranfrage hat, bewerte es als relevant. \n
-        Gib eine binäre Bewertung von 'ja' oder 'nein' Bewertung, um anzuzeigen ob das Dokuemnt relevant ist zur Nutzeranfrage oder nicht.
-    #grade_prompt = PromptTemplate(input_variables = ["context", "question"],
-                                  template = xxx)
-    """
     # Tool
     grade_tool_oai = convert_to_openai_tool(grade)
@@ -327,8 +317,7 @@ def grade_documents_direct(prompt, documents):
     # Chain
     chain = prompt_gesamt | llm_with_tool | parser_tool
-    print("test+++++++++++++++")
-    print(prompt)
     # Score
     filtered_docs = []
     for d in documents:
@@ -408,54 +397,6 @@ def rag_chain(llm, prompt,  retriever):
-    """
-    workflow = StateGraph(GraphState)
-    # Define the nodes
-    workflow.add_node("retrieve", retrieve)  # retrieve
-    workflow.add_node("grade_documents", grade_documents)  # grade documents
-    workflow.add_node("generate", generate)  # generate
-    #workflow.add_node("generate_ohne", generate)  # generate ohne dokumente anzuhängen
-    workflow.add_node("transform_query", transform_query)  # transform_query
-    #momentan  nicht genutzt
-    #workflow.add_node("web_search", web_search)  # web search
-    ###
-    # Fügen Sie einen Zwischenknoten hinzu, um von transform_query zu retrieve zurückzukehren
-    workflow.add_node("retrieve_redirect", retrieve)  # Dies könnte eine Wrapper-Funktion sein, die retrieve aufruft
-    # Build graph
-    workflow.set_entry_point("retrieve")
-    workflow.add_edge("retrieve", "grade_documents")
-    workflow.add_conditional_edges(
-        "grade_documents",
-        decide_to_generate,
-        {
-            "transform_query": "transform_query",
-            #"generate_ohne": "generate_ohne",
-            "generate": "generate",
-        },
-    )
-    workflow.add_edge("transform_query", "retrieve_redirect")
-    workflow.add_edge("retrieve_redirect", "retrieve")
-    #workflow.add_edge("generate_ohne", "generate")
-    workflow.add_edge("generate", END)
-    # Compile
-    app = workflow.compile()
-    #Dokumente suchen
-    inputs = {"keys": {"question": prompt}}
-    for output in app.stream(inputs):
-        for key, value in output.items():
-            # Node
-            pprint.pprint(f"Node '{key}':")
-            # Optional: print full state at each node
-            # pprint.pprint(value["keys"], indent=2, width=80, depth=None)
-        pprint.pprint("\n---\n")
-    # Final generation
-    return value['keys']['generation']
-    """
 ############################################
 # rag_chain Alternative für RAg mit Bild-Upload, da hier das llm so nicht genutzt werden kann und der prompt mit den RAG Erweiterungen anders übergeben wird
 #langchain nutzen, um prompt an llm zu leiten, aber vorher in der VektorDB suchen, um passende splits zum Prompt hinzuzufügen
@@ -1083,312 +1024,3 @@ class CustomDocTemplate(SimpleDocTemplate):
         self.canv.restoreState()
-######################################################################
-#Zustandsgraph für Langgraph, um RAG zu implementieren mit verschiedenen Zuständen
-#die durchlaufen werden:
-#1. Dokumente aus vektorstore bekommen
-#2. die Relevanz ddr Dokuemnte einschätzen
-#3. wenn zu wenig relevante infos: Frage neu formulieren
-#4. nochmal 1. und 2.
-#5. wenn nun genug relevante Dokumente: Anfrage an Modell mit den Doks
-#6. wenn nicht gneug Dokumente relevant: Anfrage an Modell ohne Doks
-#####################################################################
-# Zustandsgraph als Datenstruktur zum Umsetzen
-class GraphState(TypedDict):
-    """
-    Represents the state of our graph.
-    Attributes:
-        keys: A dictionary where each key is a string.
-    """
-    keys: Dict[str, any]
-#Methoden, um den Graph und die Zustände umzusetzen
-### Nodes ###
-# die Knoten des Graphen definieren, die der Reihe noch (bzw. je nach Outcome des Vorgänger Knotens) durchlaufen werden
-def retrieve(state, retriever):
-    """
-    Retrieve documents
-    Args:
-        state (dict): The current graph state
-    Returns:
-        state (dict): New keys added to state: documents, that contains retrieved documents, der wievielte Versuch gemacht wird
-    """
-    print("---RETRIEVE ---")
-    state_dict = state["keys"]
-    question = state_dict["question"]
-    documents = retriever.get_relevant_documents(question)
-    second_trial="ja"
-    if 'second_trial' in state_dict:
-        print("second time")
-        second_trail = "ja"
-    else:
-        print("first time")
-        second_trial="nein"
-    return {"keys": {"documents": documents, "second_trial":second_trial, "question": question, }}
-def retrieve_redirect(state):
-    """
-    Retrieve redirect (wenn nach transform:question neues retrieven gemacht werden soll)
-    Args:
-        state (dict): The current graph state
-    Returns:
-        state (dict): New key added to state: second_trial
-    """
-    print("---RETRIEVE REDIRECT---")
-    second_trial="ja"
-    state_dict = state["keys"]
-    question= state_dict["question"]
-    documents= state_dict["documents"]
-    return {"keys": {"documents": documents, "second_trial":second_trial, "question": question, }}
-def generate(state):
-    """
-    Generate answer
-    Args:
-        state (dict): The current graph state
-    Returns:
-        state (dict): New key added to state, generation, that contains LLM generation
-    """
-    print("---GENERATE---")
-    state_dict = state["keys"]
-    question = state_dict["question"]
-    documents = state_dict["documents"]
-    # Prompt
-    prompt = hub.pull("rlm/rag-prompt")
-    # LLM
-    llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.3, streaming=True)
-    # Post-processing
-    #def format_docs(docs):
-        #return "\n\n".join(doc.page_content for doc in docs)
-    # Chain
-    rag_chain = prompt | llm | StrOutputParser()
-    # Run
-    generation = rag_chain.invoke({"context": documents, "question": question})
-    return {
-        "keys": {"documents": documents, "question": question, "generation": generation}
-    }
-def generate_ohne(state):
-    """
-    Generate answer
-    Args:
-        state (dict): The current graph state
-    Returns:
-        state (dict): New key added to state, generation, that contains LLM generation
-    """
-    print("---GENERATE OHNE---")
-    state_dict = state["keys"]
-    question = state_dict["question"]
-    #documents = state_dict["documents"]
-    # Prompt
-    prompt = PromptTemplate(
-        template="""\Antworte in deutsch, wenn es nicht explizit anders gefordert wird. Wenn du die Antwort nicht kennst, antworte direkt, dass du es nicht weißt.
-        Versuche nicht es zu umschreiben. Versuche nicht, die Antwort zu erfinden oder aufzumocken. Halte die Antwort kurz aber ausführlich genug und exakt. \n\n
-        Hier ist die Useranfrage: {question} """,
-        input_variables=["question"])
-    # LLM
-    llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.3, streaming=True)
-    # Post-processing
-    #def format_docs(docs):
-        #return "\n\n".join(doc.page_content for doc in docs)
-    # Chain
-    llm_chain = prompt | llm | StrOutputParser()
-    # Run
-    generation = llm_chain.invoke({ "question": question})
-    return {
-        "keys": {"question": question, "generation": generation}
-    }
-def grade_documents(state):
-    """
-    Determines whether the retrieved documents are relevant to the question.
-    Args:
-        state (dict): The current graph state
-    Returns:
-        state (dict): Updates documents key with relevant documents
-    """
-    print("---CHECK RELEVANCE---")
-    state_dict = state["keys"]
-    question = state_dict["question"]
-    documents = state_dict["documents"]
-    second_trial =state_dict["second_trial"]
-    # Data model
-    class grade(BaseModel):
-        """Binary score for relevance check."""
-        binary_score: str = Field(description="Relevanz Bewertung 'ja' oder 'nein'")
-    # LLM
-    model = ChatOpenAI(temperature=0.3, model="gpt-4-0125-preview", streaming=True)
-    # Tool
-    grade_tool_oai = convert_to_openai_tool(grade)
-    # LLM with tool and enforce invocation
-    llm_with_tool = model.bind(
-        tools=[convert_to_openai_tool(grade_tool_oai)],
-        tool_choice={"type": "function", "function": {"name": "grade"}},
-    )
-    # Parser
-    parser_tool = PydanticToolsParser(tools=[grade])
-    # Prompt
-    prompt = PromptTemplate(
-        template="""Du bist ein Bewerter, der die Relevanz von einem erhaltenen Dokument zu einer Nutzeranfrage bewerten soll. \n
-        Hier ist das erhaltene Dokument: \n\n {context} \n\n
-        Hier ist die Nutzeranfrage: {question} \n
-        Wenn das erhaltene Dokument Keywörter oder semantische Bedeutung in Bezug auf die Nutzeranfrage hat, bewerte es als relevant. \n
-        Gib eine binäre Bewertung von 'ja' oder 'nein' Bewertung, um anzuzeigen ob das Dokuemnt relevant ist zur Nutzeranfrage oder nicht.""",
-        input_variables=["context", "question"],
-    )
-    # Chain
-    chain = prompt | llm_with_tool | parser_tool
-    # Score
-    filtered_docs = []
-    anzahl_relevant = 0
-    search = "nein"  # Default do not opt for re-questioning to supplement retrieval
-    for d in documents:
-        score = chain.invoke({"question": question, "context": d.page_content})
-        grade = score[0].binary_score
-        if grade == "ja":
-            #search = "nein"  # mind. ein relevantes Dokument -> keine Websuche nötig
-            print("---Bewertung: Dokument ist relevant---")
-            anzahl_relevant = anzahl_relevant +1
-            filtered_docs.append(d)
-        else:
-            print("---Bewertung: Dokument irrelevant---")
-            search = "ja"  # mind ein Dokument irrelevant -> Frage umformulieren
-            continue
-    #wenn mehrheit der Dokumente relevant -> generieren starten damit
-    if (anzahl_relevant>= len(documents)/2):
-        search = "nein"
-    print("second trial grade_docs:.....................")
-    print(second_trial)
-    return {
-        "keys": {
-            "documents": filtered_docs,
-            "question": question,
-            "search_again": search,
-            "second_trial": second_trial
-        }
-    }
-def transform_query(state):
-    """
-    Transform the query to produce a better question.
-    Args:
-        state (dict): The current graph state
-    Returns:
-        state (dict): Updates question key with a re-phrased question
-    """
-    print("---TRANSFORM QUERY---")
-    state_dict = state["keys"]
-    question = state_dict["question"]
-    documents = state_dict["documents"]
-    # Create a prompt template with format instructions and the query
-    prompt = PromptTemplate(
-        template="""Du generierst Fragen, die optimiert sind für das Retrieval von Dokumenten. \n
-        Schaue auf den input und versuche die zugrundeliegende Absicht / Bedeutung zu bewerten. \n
-        Hier ist die ursprüngliche Frage:
-        \n ------- \n
-        {question}
-        \n ------- \n
-        Formuliere eine verbesserte Frage: """,
-        input_variables=["question"],
-    )
-    # Grader
-    model = ChatOpenAI(temperature=0, model="gpt-4-0125-preview", streaming=True)
-    # Prompt
-    chain = prompt | model | StrOutputParser()
-    better_question = chain.invoke({"question": question})
-    second_trial="ja"
-    return {"keys": {"documents": documents, "question": better_question, "second_trial" : second_trial}}
-#websuche zur Zeit nicht in gebrauch
-def web_search(state):
-    """
-    Web search based on the re-phrased question using Tavily API.
-    Args:
-        state (dict): The current graph state
-    Returns:
-        state (dict): Updates documents key with appended web results
-    """
-    print("---WEB Suche---")
-    state_dict = state["keys"]
-    question = state_dict["question"]
-    documents = state_dict["documents"]
-    tool = TavilySearchResults()
-    docs = tool.invoke({"query": question})
-    web_results = "\n".join([d["content"] for d in docs])
-    web_results = Document(page_content=web_results)
-    documents.append(web_results)
-    return {"keys": {"documents": documents, "question": question}}
-### Edges
-def decide_to_generate(state):
-    """
-    Determines whether to generate an answer or re-generate a question for a new retriever question or generate without documents attached
-    Args:
-        state (dict): The current state of the agent, including all keys.
-    Returns:
-        str: Next node to call
-    """
-    print("---ENTSCHEIDE ZU GENERIEREN---")
-    print("current state")
-    print(state["keys"])
-    print("-------------------------------")
-    state_dict = state["keys"]
-    question = state_dict["question"]
-    filtered_documents = state_dict["documents"]
-    search_again = state_dict["search_again"]
-    second_trial=state_dict["second_trial"]
-    if search_again == "ja" :
-        if (not second_trial == "ja"):
-            # All documents have been filtered check_relevance
-            # We will re-generate a new query
-            print("---ENTSCHEIDUNG: VERÄNDERE DIE FRAGE ---")
-            return "transform_query"
-        else:
-            # keine neue frage, sondern generieren - ohne Dokumente anzuhängen
-            print("---ENTSCHEIDUNG: Generiere ohne Dokumente---")
-            return "generate"
-    else:
-        # We have relevant documents, so generate answer
-        print("---ENTSCHEIDUNG: GENERIERE---")
-        return "generate"

 from langchain.retrievers.tavily_search_api import TavilySearchAPIRetriever
 from typing import Dict, TypedDict
 from langchain_core.messages import BaseMessage
+from langchain_community.embeddings.openai import OpenAIEmbeddings
 from langchain.prompts import PromptTemplate
     # LLM
     model = ChatOpenAI(temperature=0.3, model="gpt-3.5-turbo-1106", streaming=True)
     # Tool
     grade_tool_oai = convert_to_openai_tool(grade)
     # Chain
     chain = prompt_gesamt | llm_with_tool | parser_tool
     # Score
     filtered_docs = []
     for d in documents:
 ############################################
 # rag_chain Alternative für RAg mit Bild-Upload, da hier das llm so nicht genutzt werden kann und der prompt mit den RAG Erweiterungen anders übergeben wird
 #langchain nutzen, um prompt an llm zu leiten, aber vorher in der VektorDB suchen, um passende splits zum Prompt hinzuzufügen
         self.canv.restoreState()