OpenData-Bordeaux-RSE

Running

App Files Files Community

Ilyas KHIAT commited on May 30

Commit

38cf0bb

•

1 Parent(s): ce4fc2a

chatbot and bug fix

Browse files

Files changed (4) hide show

app.py +6 -1
chat_with_pps.py +75 -0
partie_prenante_carte.py +64 -17
pp_viz.py +9 -9

app.py CHANGED Viewed

@@ -20,6 +20,7 @@ from collaborons import display_company_selection_for_materiality,display_materi
 from documentations import display_documentation
 from RAG_PDF_WEB import rag_pdf_web
 from prompt import get_prompts_list,prompt_execution,execute_prompt
 def main():
     st.markdown(":point_left: Cliquez pour vous inspirer", unsafe_allow_html=True)
@@ -71,7 +72,8 @@ def main():
                 "Générations de contenus RSE",
                 "Parties prenantes",
                 "Cartographie",
-                "Matrice de matérialité"
             ]
         )
@@ -95,6 +97,9 @@ def main():
             if selected_company:
                 display_materiality_matrix(selected_company, data, bziiit_data)
         elif ia_mode == "Audit flash RSE de vos contenus":
             rag_pdf_web()

 from documentations import display_documentation
 from RAG_PDF_WEB import rag_pdf_web
 from prompt import get_prompts_list,prompt_execution,execute_prompt
+from chat_with_pps import display_chat
 def main():
     st.markdown(":point_left: Cliquez pour vous inspirer", unsafe_allow_html=True)
                 "Générations de contenus RSE",
                 "Parties prenantes",
                 "Cartographie",
+                "Matrice de matérialité",
+                "Chatbot Matrice de matérialité"
             ]
         )
             if selected_company:
                 display_materiality_matrix(selected_company, data, bziiit_data)
+        elif ia_mode == "Chatbot Matrice de matérialité":
+            display_chat()
         elif ia_mode == "Audit flash RSE de vos contenus":
             rag_pdf_web()

chat_with_pps.py ADDED Viewed

	@@ -0,0 +1,75 @@

+import streamlit as st
+from langchain_core.messages import AIMessage, HumanMessage
+from langchain_openai import ChatOpenAI
+from dotenv import load_dotenv
+from langchain_core.output_parsers import StrOutputParser
+from langchain_core.prompts import ChatPromptTemplate
+load_dotenv()
+def format_context(df,brand_name):
+    formatted_string = "le nom de la marque est " + brand_name + "\n" + "Les parties prenantes et leur pouvoir en pourcentage sont les suivants:\n"
+    for index, row in df.iterrows():
+        formatted_string += f"{row['partie_prenante']}: {row['pouvoir']}%\n"
+    return formatted_string
+def get_response(user_query, chat_history, context):
+    template = """
+    Fournir des réponses précises et contextuelles en agissant comme un expert en affaires, en utilisant le contexte des parties prenantes et leur pouvoir en pourcentage pour expliquer les implications pour la marque. Le modèle doit connecter les informations du contexte et de l'historique de la conversation pour donner une réponse éclairée à la dernière question posée.
+    Contexte: {context}
+    Chat history: {chat_history}
+    User question: {user_question}
+    """
+    prompt = ChatPromptTemplate.from_template(template)
+    llm = ChatOpenAI(model="gpt-4o")
+    chain = prompt | llm | StrOutputParser()
+    return chain.stream({
+        "context": context,
+        "chat_history": chat_history,
+        "user_question": user_query,
+    })
+def display_chat():
+    # app config
+    st.title("Chatbot")
+    # session state
+    if "chat_history" not in st.session_state:
+        st.session_state.chat_history = [
+            AIMessage(content="Salut, pose-moi des questions sur tes parties prenantes."),
+        ]
+    # conversation
+    for message in st.session_state.chat_history:
+        if isinstance(message, AIMessage):
+            with st.chat_message("AI"):
+                st.write(message.content)
+        elif isinstance(message, HumanMessage):
+            with st.chat_message("Moi"):
+                st.write(message.content)
+    # user input
+    user_query = st.chat_input("Par ici...")
+    if user_query is not None and user_query != "":
+        st.session_state.chat_history.append(HumanMessage(content=user_query))
+        with st.chat_message("Moi"):
+            st.markdown(user_query)
+        with st.chat_message("AI"):
+            response = st.write_stream(get_response(user_query, st.session_state.chat_history,format_context(st.session_state['partie_prenante_grouped'],st.session_state['Nom de la marque'])))
+        st.session_state.chat_history.append(AIMessage(content=response))

partie_prenante_carte.py CHANGED Viewed

@@ -71,26 +71,22 @@ def fill_promptQ_template(input_variables, template):
     prompt = PromptTemplate(input_variables=["BRAND_NAME","BRAND_DESCRIPTION"], template=template)
     return prompt.format(BRAND_NAME=input_variables["BRAND_NAME"], BRAND_DESCRIPTION=input_variables["BRAND_DESCRIPTION"])
-template_extraction_PP = '''
-Objectif : identifiez et proposez tout les noms de marques qui serviront comme partie prenante de la marque suivante pour développer un marketing de coopération (co-op marketing)
-Le nom de la marque de référence est le suivant : {BRAND_NAME}
-Son activité est la suivante : {BRAND_DESCRIPTION}
-TA REPONSE DOIT ETRE SOUS FORME DE LISTE DE NOMS DE MARQUES
-'''
-#don't forget to add the input variables from the maim function
 def text_to_list(text):
     lines = text.replace("- ","").split('\n')
     lines = [line.split() for line in lines]
     items = [[' '.join(line[:-1]),line[-1]] for line in lines]
     # Assuming `items` is the list of items
     for item in items:
         item[1] = re.sub(r'\D', '', item[1])
     return items
 def display_list_urls():
     for index, item in enumerate(st.session_state["urls"]):
         emp = st.empty()  # Create an empty placeholder
@@ -98,6 +94,8 @@ def display_list_urls():
         # Button to delete the entry, placed in the second column
         if col2.button("❌", key=f"but{index}"):
             del st.session_state.urls[index]
             del st.session_state["parties_prenantes"][index]
             st.experimental_rerun()  # Rerun the app to update the display
@@ -112,12 +110,14 @@ def display_list_urls():
 def extract_pp(urls,input_variables):
     template_extraction_PP = '''
-    Objectif : identifiez et proposez tout les noms de marques qui serviront comme partie prenante de la marque suivante pour développer un marketing de coopération (co-op marketing)
     Le nom de la marque de référence est le suivant : {BRAND_NAME}
     Son activité est la suivante : {BRAND_DESCRIPTION}
     TA REPONSE DOIT ETRE SOUS FORME DE LISTE DE NOMS DE MARQUES
     '''
     #don't forget to add the input variables from the maim function
@@ -166,7 +166,37 @@ def disp_vertical_slider(partie_prenante):
             )
             st.write(tst)
 def display_pp():
@@ -183,6 +213,8 @@ def display_pp():
         st.session_state["urls"] = []
     if "parties_prenantes" not in st.session_state:
         st.session_state['parties_prenantes'] = []
     st.header("Parties prenantes de la marque")
     #set brand name and description
@@ -195,22 +227,35 @@ def display_pp():
     #if the user chooses to extract from website
     if option == "A partir de votre site web":
         url = st.text_input("Ajouter une URL")
         #if the user clicks on the button
         if st.button("ajouter"):
-            if url in st.session_state["urls"]:
                 st.error("URL déjà ajoutée")
             else:
                 with st.spinner("Processing..."):
                     #handle the extraction
                     input_variables = {"BRAND_NAME": brand_name, "BRAND_DESCRIPTION": brand_description}
                     partie_prenante = extract_pp([url], input_variables)
-                    partie_prenante = sorted(partie_prenante)
-                    st.session_state['parties_prenantes'].append(partie_prenante)
-                    st.session_state["urls"].append(url)
                     # alphabet = [ pp[0] for pp in partie_prenante]
                     # pouvoir = [ 50 for _ in range(len(partie_prenante))]
                     # df = pd.DataFrame({'partie_prenante': partie_prenante, 'pouvoir': pouvoir, 'code couleur': partie_prenante})
@@ -227,8 +272,10 @@ def display_pp():
                     # disp_vertical_slider(partie_prenante)
                     # st.altair_chart(c, use_container_width=True)
     display_list_urls()
     display_viz()

     prompt = PromptTemplate(input_variables=["BRAND_NAME","BRAND_DESCRIPTION"], template=template)
     return prompt.format(BRAND_NAME=input_variables["BRAND_NAME"], BRAND_DESCRIPTION=input_variables["BRAND_DESCRIPTION"])
 def text_to_list(text):
     lines = text.replace("- ","").split('\n')
     lines = [line.split() for line in lines]
     items = [[' '.join(line[:-1]),line[-1]] for line in lines]
     # Assuming `items` is the list of items
     for item in items:
         item[1] = re.sub(r'\D', '', item[1])
     return items
+def delete_pp(pps):
+    for pp in pps:
+        st.session_state['partie_prenante_grouped'] = st.session_state['partie_prenante_grouped'].drop(st.session_state['partie_prenante_grouped'][st.session_state['partie_prenante_grouped']['partie_prenante'] == pp].index)
+        st.session_state['partie_prenante_grouped'].reset_index()
 def display_list_urls():
     for index, item in enumerate(st.session_state["urls"]):
         emp = st.empty()  # Create an empty placeholder
         # Button to delete the entry, placed in the second column
         if col2.button("❌", key=f"but{index}"):
+            temp  = st.session_state['parties_prenantes'][index]
+            delete_pp(temp)
             del st.session_state.urls[index]
             del st.session_state["parties_prenantes"][index]
             st.experimental_rerun()  # Rerun the app to update the display
 def extract_pp(urls,input_variables):
     template_extraction_PP = '''
+    Objectif : identifiez tout les noms de marques qui sont des parties prenantes de la marque suivante pour développer un marketing de coopération (co-op marketing)
     Le nom de la marque de référence est le suivant : {BRAND_NAME}
     Son activité est la suivante : {BRAND_DESCRIPTION}
     TA REPONSE DOIT ETRE SOUS FORME DE LISTE DE NOMS DE MARQUES
+    SI TU NE TROUVES PAS DE NOM DE MARQUE, REPONDS "444"
     '''
     #don't forget to add the input variables from the maim function
             )
             st.write(tst)
+def add_pp(new_pp, default_value=50):
+    new_pp = sorted(new_pp)
+    new_pp = [item.lower().capitalize() for item in new_pp]
+    st.session_state['parties_prenantes'].append(new_pp)
+    for pp in new_pp:
+        if pp not in st.session_state['partie_prenante_grouped']['partie_prenante'].values:
+            st.session_state['partie_prenante_grouped'].loc[len(st.session_state['partie_prenante_grouped'])] = [pp, default_value, pp]
+    st.session_state['partie_prenante_grouped'] = st.session_state['partie_prenante_grouped'].sort_values(by='partie_prenante')
+    st.session_state['partie_prenante_grouped'] = st.session_state['partie_prenante_grouped'].reset_index(drop=True)
+def complete_and_verify_url(partial_url):
+    # Regex pattern for validating a URL
+    regex = re.compile(
+        r'^(?:http|ftp)s?://'  # http:// or https://
+        r'(?:(?:[A-Z0-9](?:[A-Z0-9-]{0,61}[A-Z0-9])?\.)+[A-Z]{2,6}\.?|'  # domain
+        r'localhost|'  # localhost...
+        r'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})'  # ...or ip
+        r'(?::\d+)?'  # optional port
+        r'(?:/?|[/?]\S+)$', re.IGNORECASE)
+    # Complete the URL if it doesn't have http:// or https://
+    if not partial_url.startswith(('http://', 'https://')):
+        complete_url = 'http://' + partial_url
+    else:
+        complete_url = partial_url
+    # Check if the URL is valid
+    if re.match(regex, complete_url):
+        return (True, complete_url)
+    else:
+        return (False, complete_url)
 def display_pp():
         st.session_state["urls"] = []
     if "parties_prenantes" not in st.session_state:
         st.session_state['parties_prenantes'] = []
+    if "partie_prenante_grouped" not in st.session_state: #servira pour le plot et la cartographie
+        st.session_state['partie_prenante_grouped'] = pd.DataFrame(columns=['partie_prenante', 'pouvoir', 'Code couleur'])
     st.header("Parties prenantes de la marque")
     #set brand name and description
     #if the user chooses to extract from website
     if option == "A partir de votre site web":
         url = st.text_input("Ajouter une URL")
         #if the user clicks on the button
         if st.button("ajouter"):
+            is_valid,url = complete_and_verify_url(url)
+            if not is_valid:
+                st.error("URL invalide")
+            elif url in st.session_state["urls"] :
                 st.error("URL déjà ajoutée")
             else:
+                # Création de l'expander
+                with st.expander("Cliquez ici pour éditer et voir le document"):
+                    cleaned_text = re.sub(r'\n\n+', '\n\n', get_docs_from_website(url)[0].page_content.strip())
+                    text_value = st.text_area("Modifier le texte ci-dessous:", value=cleaned_text, height=300)
+                    if st.button('Sauvegarder'):
+                        st.success("Texte sauvegardé avec succès!")
                 with st.spinner("Processing..."):
                     #handle the extraction
                     input_variables = {"BRAND_NAME": brand_name, "BRAND_DESCRIPTION": brand_description}
                     partie_prenante = extract_pp([url], input_variables)
+                    if "444" in partie_prenante:
+                        st.error("Aucune partie prenante trouvée")
+                    else:
+                        partie_prenante = sorted(partie_prenante)
+                        st.session_state["urls"].append(url)
+                        add_pp(partie_prenante)
                     # alphabet = [ pp[0] for pp in partie_prenante]
                     # pouvoir = [ 50 for _ in range(len(partie_prenante))]
                     # df = pd.DataFrame({'partie_prenante': partie_prenante, 'pouvoir': pouvoir, 'code couleur': partie_prenante})
                     # disp_vertical_slider(partie_prenante)
                     # st.altair_chart(c, use_container_width=True)
     display_list_urls()
     display_viz()
+    st.write(st.session_state["partie_prenante_grouped"])

pp_viz.py CHANGED Viewed

@@ -20,25 +20,25 @@ def display_viz():
         partie_prenante_non_filtre = [item.lower().capitalize() for sublist in parties_prenantes for item in sublist]
         partie_prenante = sorted(list(set(partie_prenante_non_filtre)))
         pouvoir = [ 50 for _ in range(len(partie_prenante))]
-        df = pd.DataFrame({'partie_prenante': partie_prenante, 'pouvoir': pouvoir, 'Code couleur': partie_prenante})
         c = (
-        alt.Chart(df)
         .mark_circle(size=800)
         .encode(x="partie_prenante", y=alt.Y("pouvoir",scale=alt.Scale(domain=[0,100])), color="Code couleur",tooltip=["partie_prenante","pouvoir"])
-        ).configure_legend(orient='top',direction="vertical").properties(height=600)
         number_of_sliders = len(partie_prenante)
         st.write("Modifiez le pouvoir des parties prenantes en utilisant les sliders ci-dessous")
         bar = st.columns(number_of_sliders)
         for i in range(number_of_sliders):
             with bar[i]:
-                temp = 50
-                df["pouvoir"][i] = vertical_slider(
                     label=partie_prenante[i],
                     height=100,
                     key=partie_prenante[i],
-                    default_value=temp,
                     thumb_color= "orange", #Optional - Defaults to Streamlit Red
                     step=1,
                     min_value=0,
@@ -46,6 +46,6 @@ def display_viz():
                     value_always_visible=False,
                 )
         st.altair_chart(c, use_container_width=True)
-        data = [{'id':partie_prenante[i], 'name':partie_prenante[i],'pouvoir':int(df["pouvoir"][i])} for i in range(len(partie_prenante))]
-        slist = DraggableList(data)
-        st.write(slist)

         partie_prenante_non_filtre = [item.lower().capitalize() for sublist in parties_prenantes for item in sublist]
         partie_prenante = sorted(list(set(partie_prenante_non_filtre)))
         pouvoir = [ 50 for _ in range(len(partie_prenante))]
         c = (
+        alt.Chart(st.session_state['partie_prenante_grouped'])
         .mark_circle(size=800)
         .encode(x="partie_prenante", y=alt.Y("pouvoir",scale=alt.Scale(domain=[0,100])), color="Code couleur",tooltip=["partie_prenante","pouvoir"])
+        ).configure_legend(orient='bottom',direction="vertical").properties(height=600)
         number_of_sliders = len(partie_prenante)
         st.write("Modifiez le pouvoir des parties prenantes en utilisant les sliders ci-dessous")
         bar = st.columns(number_of_sliders)
         for i in range(number_of_sliders):
             with bar[i]:
+                st.session_state['partie_prenante_grouped']['pouvoir'][i] = vertical_slider(
                     label=partie_prenante[i],
                     height=100,
                     key=partie_prenante[i],
+                    default_value=int(st.session_state['partie_prenante_grouped']['pouvoir'][i]),
                     thumb_color= "orange", #Optional - Defaults to Streamlit Red
                     step=1,
                     min_value=0,
                     value_always_visible=False,
                 )
         st.altair_chart(c, use_container_width=True)
+        # data = [{'id':partie_prenante[i], 'name':partie_prenante[i],'pouvoir':int(df["pouvoir"][i])} for i in range(len(partie_prenante))]
+        # slist = DraggableList(data)
+        # st.write(slist)