CHATBOT_SB

Sleeping

App Files Files Community

markIA23 commited on Sep 20, 2024

Commit

f5b50b3

verified ·

1 Parent(s): 536f8a3

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -21

app.py CHANGED Viewed

@@ -7,12 +7,10 @@ from llama_index.core import Settings
 import os
 import base64
-# Load environment variables
 load_dotenv()
-#meta-llama/Meta-Llama-3.1-70B-Instruct, mistralai/Mistral-7B-Instruct-v0.3
-# Configure the Llama index settings
 Settings.llm = HuggingFaceInferenceAPI(
     model_name="mistralai/Mistral-7B-Instruct-v0.3",
     tokenizer_name="mistralai/Mistral-7B-Instruct-v0.3",
@@ -25,18 +23,18 @@ Settings.embed_model = HuggingFaceEmbedding(
     model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"  # Modelo en español de Hugging Face
 )
-# Define the directory for persistent storage and data
 PERSIST_DIR = "./db"
 DATA_DIR = "data"
-# Ensure data directory exists
 os.makedirs(DATA_DIR, exist_ok=True)
 os.makedirs(PERSIST_DIR, exist_ok=True)
-# Fixed PDF file path
 FIXED_PDF_PATH = os.path.join(DATA_DIR, "saved_pdf.pdf")
-# Ingest data once on startup
 @st.cache_data
 def load_data():
     documents = SimpleDirectoryReader(DATA_DIR).load_data()
@@ -45,12 +43,12 @@ def load_data():
     index.storage_context.persist(persist_dir=PERSIST_DIR)
     return index
-# Handle user queries
 def handle_query(query, index):
     chat_text_qa_msgs = [
         (
             "user",
-            """Responde en español con un máximo de 100 palabras y agrega que para más información en <https://docs.google.com/document/d/1mab0yt8us-XGugwzAsQ_8K-XLn1_VJ8tlTV7FW3Wv2E/edit?usp=sharing>. Recuerda que Informática Educativa no es virtual, sino a distancia los fines de semana. Simplifica y resume para ser conciso, preciso y directo. Eres Lobito, asistente de la UPNFM. Proporciona respuestas precisas basadas en el contexto dado sobre la UPNFM y la DFP. Si la pregunta no coincide, sugiere reformularla. Identifica las secciones relevantes del contexto y organiza las respuestas lógicamente si abarcan varias secciones.
                Contexto:
                {context_str}
                Pregunta:
@@ -70,11 +68,11 @@ def handle_query(query, index):
         response = answer['response']
     else:
         return "Lo siento, no pude procesar tu pregunta. ¿Podrías reformularla o hacer una pregunta diferente?"
     # Palabras y frases a evitar en las respuestas
     palabras_prohibidas = [
         "en el contexto proporcionado no hay información",
-        "Empty Response",
         "the provided text does not contain",
         "en el contexto proporcionado, no hay información"
     ]
@@ -85,13 +83,11 @@ def handle_query(query, index):
     return response
-# Initialize session state
 if 'messages' not in st.session_state:
     st.session_state.messages = [{'role': 'assistant', "content": '¡Hola!, me llamo Lobito. Soy tu asesor personalizado.'}]
-# Streamlit app initialization
 st.title("Chatbot de dudas DFP")
 st.markdown("Resuelvo dudas sobre el régimen económico y admisión de la Dirección de Formación Permanente.")
 st.markdown("""
@@ -99,25 +95,30 @@ st.markdown("""
     <iframe src="https://www.youtube.com/embed/UFqvwF9xvAM?si=4qFqwSpsr5Fh9bd7" style="position: absolute; top: 0; left: 0; width: 100%; height: 100%;" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" allowfullscreen></iframe>
 </div>
 """, unsafe_allow_html=True)
-st.markdown("<small>Toda la información en el documento: <https://docs.google.com/document/d/1mab0yt8us-XGugwzAsQ_8K-XLn1_VJ8tlTV7FW3Wv2E/edit?usp=sharing></small>", unsafe_allow_html=True)
-# Display the fixed PDF
 if os.path.exists(FIXED_PDF_PATH):
     index = load_data()
 else:
     st.error("No pude cargar la información.")
-# Chat input
 user_prompt = st.chat_input("¿En qué te puedo ayudar?:")
 if user_prompt:
     st.session_state.messages.append({'role': 'user', "content": user_prompt})
     response = handle_query(user_prompt, index)
     st.session_state.messages.append({'role': 'assistant', "content": response})
 for message in st.session_state.messages:
     with st.chat_message(message['role']):
         st.write(message['content'])
 st.markdown("<small>Desarrollado por el Profesor Marco Medina Rajo.</small>", unsafe_allow_html=True)
 st.markdown('<p style="font-size:10px;">La información generada por el chatbot puede ser incorrecta. Revisa el documento.</p>', unsafe_allow_html=True)

 import os
 import base64
+# Cargar variables de entorno
 load_dotenv()
+# Configurar los modelos de LLM y Embeddings
 Settings.llm = HuggingFaceInferenceAPI(
     model_name="mistralai/Mistral-7B-Instruct-v0.3",
     tokenizer_name="mistralai/Mistral-7B-Instruct-v0.3",
     model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"  # Modelo en español de Hugging Face
 )
+# Definir los directorios para almacenamiento persistente y datos
 PERSIST_DIR = "./db"
 DATA_DIR = "data"
+# Asegurar que los directorios existan
 os.makedirs(DATA_DIR, exist_ok=True)
 os.makedirs(PERSIST_DIR, exist_ok=True)
+# Ruta fija para el archivo PDF
 FIXED_PDF_PATH = os.path.join(DATA_DIR, "saved_pdf.pdf")
+# Ingestar datos una vez al inicio
 @st.cache_data
 def load_data():
     documents = SimpleDirectoryReader(DATA_DIR).load_data()
     index.storage_context.persist(persist_dir=PERSIST_DIR)
     return index
+# Manejar consultas de usuario
 def handle_query(query, index):
     chat_text_qa_msgs = [
         (
             "user",
+            """Responde en español con un máximo de 100 palabras y agrega que para más información en <a href="https://docs.google.com/document/d/1mab0yt8us-XGugwzAsQ_8K-XLn1_VJ8tlTV7FW3Wv2E/edit?usp=sharing">Aquí la información</a>. Recuerda que Informática Educativa no es virtual, sino a distancia los fines de semana. Simplifica y resume para ser conciso, preciso y directo. Eres Lobito, asistente de la UPNFM. Proporciona respuestas precisas basadas en el contexto dado sobre la UPNFM y la DFP. Si la pregunta no coincide, sugiere reformularla. Identifica las secciones relevantes del contexto y organiza las respuestas lógicamente si abarcan varias secciones.
                Contexto:
                {context_str}
                Pregunta:
         response = answer['response']
     else:
         return "Lo siento, no pude procesar tu pregunta. ¿Podrías reformularla o hacer una pregunta diferente?"
     # Palabras y frases a evitar en las respuestas
     palabras_prohibidas = [
         "en el contexto proporcionado no hay información",
+        "empty response",
         "the provided text does not contain",
         "en el contexto proporcionado, no hay información"
     ]
     return response
+# Inicializar el estado de la sesión
 if 'messages' not in st.session_state:
     st.session_state.messages = [{'role': 'assistant', "content": '¡Hola!, me llamo Lobito. Soy tu asesor personalizado.'}]
+# Inicialización de la aplicación Streamlit
 st.title("Chatbot de dudas DFP")
 st.markdown("Resuelvo dudas sobre el régimen económico y admisión de la Dirección de Formación Permanente.")
 st.markdown("""
     <iframe src="https://www.youtube.com/embed/UFqvwF9xvAM?si=4qFqwSpsr5Fh9bd7" style="position: absolute; top: 0; left: 0; width: 100%; height: 100%;" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" allowfullscreen></iframe>
 </div>
 """, unsafe_allow_html=True)
+# Actualización de la URL en Markdown a un enlace HTML descriptivo
+st.markdown("""
+<small>Toda la información en el documento: <a href="https://docs.google.com/document/d/1mab0yt8us-XGugwzAsQ_8K-XLn1_VJ8tlTV7FW3Wv2E/edit?usp=sharing">Aquí la información</a></small>
+""", unsafe_allow_html=True)
+# Mostrar el PDF fijo si existe
 if os.path.exists(FIXED_PDF_PATH):
     index = load_data()
 else:
     st.error("No pude cargar la información.")
+# Entrada de chat
 user_prompt = st.chat_input("¿En qué te puedo ayudar?:")
 if user_prompt:
     st.session_state.messages.append({'role': 'user', "content": user_prompt})
     response = handle_query(user_prompt, index)
     st.session_state.messages.append({'role': 'assistant', "content": response})
+# Mostrar los mensajes de la sesión
 for message in st.session_state.messages:
     with st.chat_message(message['role']):
         st.write(message['content'])
+# Información adicional
 st.markdown("<small>Desarrollado por el Profesor Marco Medina Rajo.</small>", unsafe_allow_html=True)
 st.markdown('<p style="font-size:10px;">La información generada por el chatbot puede ser incorrecta. Revisa el documento.</p>', unsafe_allow_html=True)