Spaces:

JaphetHernandez
/

PotentialTalents_2

Sleeping

App Files Files Community

JaphetHernandez commited on Oct 23, 2024

Commit

bec3852

verified ·

1 Parent(s): 33bb252

Update app.py

Browse files

Files changed (1) hide show

app.py +35 -40

app.py CHANGED Viewed

@@ -1,47 +1,42 @@
-import streamlit as st
 import pandas as pd
-from langchain.prompts import PromptTemplate
-from langchain.llms import OpenAI
-# Cargar archivo CSV
-uploaded_file = st.file_uploader("Sube un archivo CSV", type=["csv"])
 if uploaded_file is not None:
     # Leer el archivo CSV
     df = pd.read_csv(uploaded_file)
-    st.write("Vista previa del archivo CSV:", df.head())
-    if 'job_title' in df.columns:
-        # Preguntar al usuario por el query
-        query = st.text_input("Por favor ingresa tu consulta para calcular similitud de coseno:")
-        if query:
-            # Crear el prompt para el modelo, dándole instrucciones detalladas
-            prompt_template = """
-            Tienes un archivo CSV con la columna 'job_title'. Tu tarea es calcular el puntaje de similitud de coseno entre cada registro de 'job_title' y el siguiente query: '{query}'.
-            Necesitas crear una nueva columna 'Score' que contenga los puntajes de similitud para cada registro.
-            Luego, debes ordenar los registros de mayor a menor según el valor en la columna 'Score'.
-            Devuélveme el DataFrame resultante con los registros ordenados.
-            Aquí tienes los datos de la columna 'job_title':
-            {job_titles}
-            """
-            # Convertir los títulos de trabajo a una lista
-            job_titles = df['job_title'].tolist()
-            # Formatear el prompt con el query y los job_titles
-            prompt = PromptTemplate(
-                template=prompt_template,
-                input_variables=["query", "job_titles"]
-            ).format(query=query, job_titles=job_titles)
-            # Llamar al modelo de lenguaje usando LangChain y OpenAI
-            llm = OpenAI(temperature=0.7)  # Llama a GPT u otro LLM
-            response = llm(prompt)
-            # Mostrar la respuesta del modelo (el DataFrame procesado)
-            st.write("Resultados ordenados por similitud de coseno:", response)
-    else:
-        st.warning("El archivo CSV no contiene la columna 'job_title'.")

+import torch
 import pandas as pd
+import streamlit as st
+from langchain.llms import Llama
+from huggingface_hub import login
+# Tu token secreto de Hugging Face
+huggingface_token = st.secrets["HUGGINGFACEHUB_API_TOKEN"]
+login(huggingface_token)
+# Cargar el modelo Llama 3.1
+model_name = "meta-llama/llama-3.1-8b-instruct"  # Asegúrate de que este sea el nombre correcto del modelo
+llm = Llama(model_name=model_name, torch_dtype=torch.float16)
+# Interfaz de Streamlit
+st.title("Cosine Similarity con Llama 3.1")
+# Subida de archivo CSV
+uploaded_file = st.file_uploader("Sube un archivo CSV", type=["csv"])
 if uploaded_file is not None:
     # Leer el archivo CSV
     df = pd.read_csv(uploaded_file)
+    # Solicitar un query al usuario
+    query = st.text_input("Por favor ingresa tu consulta:")
+    if query:
+        # Crear el prompt para calcular la similitud del coseno
+        prompt = f"""
+        Con la columna 'job_title' del csv, tiene que calcular los cosine similarity score entre cada registro y el query,
+        tiene que crear una columna nueva 'Score' con dichos scores y además tiene que ordenar los registros de mayor a menor valor de 'Score'.
+        El query es: {query}
+        """
+        # Llamar al modelo Llama con el prompt
+        response = llm(prompt)
+        # Mostrar la respuesta del modelo
+        st.write("Respuesta del modelo:", response)
+        # Aquí puedes procesar la respuesta para extraer los scores y ordenar los registros
+        # Esto asume que el modelo te devuelve una respuesta estructurada en un formato que puedes procesar