Update main.py
Browse files
main.py
CHANGED
@@ -19,7 +19,7 @@ from langchain.callbacks.base import BaseCallbackHandler
|
|
19 |
from langchain.chains import (
|
20 |
StuffDocumentsChain, ConversationalRetrievalChain
|
21 |
)
|
22 |
-
from langchain_core.tracers.context import tracing_v2_enabled
|
23 |
#from langchain_core.tools import Tool
|
24 |
|
25 |
import chainlit as cl
|
@@ -31,8 +31,8 @@ from deep_translator import GoogleTranslator
|
|
31 |
|
32 |
from datetime import timedelta
|
33 |
|
34 |
-
from literalai import
|
35 |
-
|
36 |
|
37 |
@cl.password_auth_callback
|
38 |
def auth_callback(username: str, password: str):
|
@@ -51,7 +51,8 @@ def auth_callback(username: str, password: str):
|
|
51 |
identifier=ident + " : 🧑🎓 User Datapcc", metadata={"role": "user", "provider": "credentials"}
|
52 |
)
|
53 |
|
54 |
-
|
|
|
55 |
os.environ['HUGGINGFACEHUB_API_TOKEN'] = os.environ['HUGGINGFACEHUB_API_TOKEN']
|
56 |
repo_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
|
57 |
llm = HuggingFaceEndpoint(
|
@@ -71,7 +72,8 @@ def LLModel():
|
|
71 |
#)
|
72 |
return llm
|
73 |
|
74 |
-
|
|
|
75 |
if categorie == "bibliographie-OPP-DGDIN":
|
76 |
index_name = "all-venus"
|
77 |
embeddings = HuggingFaceEmbeddings()
|
@@ -93,8 +95,9 @@ def VectorDatabase(categorie):
|
|
93 |
|
94 |
return vectorstore
|
95 |
|
96 |
-
|
97 |
-
|
|
|
98 |
if categorie == "bibliographie-OPP-DGDIN":
|
99 |
retriever = vectorstore.as_retriever(search_type="similarity_score_threshold", search_kwargs={"score_threshold": .7, "k": 150,"filter": {'categorie': {'$eq': categorie}}})
|
100 |
elif categorie == "year":
|
@@ -105,8 +108,9 @@ def Retriever(categorie):
|
|
105 |
retriever = vectorstore.as_retriever(search_type="similarity_score_threshold", search_kwargs={"score_threshold": .7, "k": 200,"filter": {"title": {"$eq": "videos-confinement-timeline"}}})
|
106 |
return retriever
|
107 |
|
108 |
-
|
109 |
-
|
|
|
110 |
results = []
|
111 |
test = []
|
112 |
sources_text = ""
|
@@ -214,13 +218,15 @@ async def on_chat_start():
|
|
214 |
message_history = ChatMessageHistory()
|
215 |
memory = ConversationBufferMemory(memory_key="chat_history",output_key="answer",chat_memory=message_history,return_messages=True)
|
216 |
|
|
|
|
|
217 |
qa = ConversationalRetrievalChain.from_llm(
|
218 |
-
|
219 |
memory=memory,
|
220 |
chain_type="stuff",
|
221 |
return_source_documents=True,
|
222 |
verbose=False,
|
223 |
-
retriever=
|
224 |
)
|
225 |
cl.user_session.set("runnable", qa)
|
226 |
cl.user_session.set("memory", memory)
|
@@ -254,11 +260,10 @@ async def on_message(message: cl.Message):
|
|
254 |
cl.Text(name="Sources", content=sources_text, display="inline")
|
255 |
)
|
256 |
|
257 |
-
|
258 |
cb = cl.AsyncLangchainCallbackHandler()
|
259 |
-
|
260 |
-
|
261 |
-
answer = results["answer"]
|
262 |
|
263 |
await cl.Message(content=GoogleTranslator(source='auto', target='fr').translate(answer)).send()
|
264 |
|
|
|
19 |
from langchain.chains import (
|
20 |
StuffDocumentsChain, ConversationalRetrievalChain
|
21 |
)
|
22 |
+
#from langchain_core.tracers.context import tracing_v2_enabled
|
23 |
#from langchain_core.tools import Tool
|
24 |
|
25 |
import chainlit as cl
|
|
|
31 |
|
32 |
from datetime import timedelta
|
33 |
|
34 |
+
from literalai import AsyncLiteralClient
|
35 |
+
async_literal_client = AsyncLiteralClient(api_key=os.getenv("LITERAL_API_KEY"))
|
36 |
|
37 |
@cl.password_auth_callback
|
38 |
def auth_callback(username: str, password: str):
|
|
|
51 |
identifier=ident + " : 🧑🎓 User Datapcc", metadata={"role": "user", "provider": "credentials"}
|
52 |
)
|
53 |
|
54 |
+
@cl.step(type="llm")
|
55 |
+
async def LLModel():
|
56 |
os.environ['HUGGINGFACEHUB_API_TOKEN'] = os.environ['HUGGINGFACEHUB_API_TOKEN']
|
57 |
repo_id = "mistralai/Mixtral-8x7B-Instruct-v0.1"
|
58 |
llm = HuggingFaceEndpoint(
|
|
|
72 |
#)
|
73 |
return llm
|
74 |
|
75 |
+
@cl.step(type="tool")
|
76 |
+
async def VectorDatabase(categorie):
|
77 |
if categorie == "bibliographie-OPP-DGDIN":
|
78 |
index_name = "all-venus"
|
79 |
embeddings = HuggingFaceEmbeddings()
|
|
|
95 |
|
96 |
return vectorstore
|
97 |
|
98 |
+
@cl.step(type="retrieval")
|
99 |
+
async def Retriever(categorie):
|
100 |
+
vectorstore = await VectorDatabase(categorie)
|
101 |
if categorie == "bibliographie-OPP-DGDIN":
|
102 |
retriever = vectorstore.as_retriever(search_type="similarity_score_threshold", search_kwargs={"score_threshold": .7, "k": 150,"filter": {'categorie': {'$eq': categorie}}})
|
103 |
elif categorie == "year":
|
|
|
108 |
retriever = vectorstore.as_retriever(search_type="similarity_score_threshold", search_kwargs={"score_threshold": .7, "k": 200,"filter": {"title": {"$eq": "videos-confinement-timeline"}}})
|
109 |
return retriever
|
110 |
|
111 |
+
@cl.step(type="embedding")
|
112 |
+
async def Search(input, categorie):
|
113 |
+
vectorstore = await VectorDatabase(categorie)
|
114 |
results = []
|
115 |
test = []
|
116 |
sources_text = ""
|
|
|
218 |
message_history = ChatMessageHistory()
|
219 |
memory = ConversationBufferMemory(memory_key="chat_history",output_key="answer",chat_memory=message_history,return_messages=True)
|
220 |
|
221 |
+
model = await LLModel()
|
222 |
+
retriever = await Retriever(res.get("name"))
|
223 |
qa = ConversationalRetrievalChain.from_llm(
|
224 |
+
model,
|
225 |
memory=memory,
|
226 |
chain_type="stuff",
|
227 |
return_source_documents=True,
|
228 |
verbose=False,
|
229 |
+
retriever=retriever
|
230 |
)
|
231 |
cl.user_session.set("runnable", qa)
|
232 |
cl.user_session.set("memory", memory)
|
|
|
260 |
cl.Text(name="Sources", content=sources_text, display="inline")
|
261 |
)
|
262 |
|
263 |
+
with literal_client.thread() as thread:
|
264 |
cb = cl.AsyncLangchainCallbackHandler()
|
265 |
+
results = await runnable.acall("Contexte : Vous êtes un chercheur de l'enseignement supérieur et vous êtes doué pour faire des analyses d'articles de recherche sur les thématiques liées à la pédagogie, en fonction des critères définis ci-avant. En fonction des informations suivantes et du contexte suivant seulement et strictement, répondez en langue française strictement à la question ci-dessous à partir du contexte ci-dessous. En plus, tu créeras et tu afficheras 3 questions supplémentaires en relation avec le contexte initial, à chaque étape de la conversation. Tu écriras et tu afficheras les 3 questions supplémentaires en relation avec le contexte initial, avec un titrage de niveau 1 qui a pour titre \"Questions en relation avec le contexte : \". Lorsque cela est possible, cite les sources du contexte. Si vous ne pouvez pas répondre à la question sur la base des informations, dites que vous ne trouvez pas de réponse ou que vous ne parvenez pas à trouver de réponse. Essayez donc de comprendre en profondeur le contexte et répondez uniquement en vous basant sur les informations fournies. Ne générez pas de réponses non pertinentes. Question : " + message.content, callbacks=[cb])
|
266 |
+
answer = results["answer"]
|
|
|
267 |
|
268 |
await cl.Message(content=GoogleTranslator(source='auto', target='fr').translate(answer)).send()
|
269 |
|