File size: 6,200 Bytes
42e670e 68dfc8f 42e670e |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 |
import sys
import os
import json
import gradio as gr
sys.path.append('src')
from procesador_de_cvs_con_llm import ProcesadorCV
use_dotenv = False
if use_dotenv:
from dotenv import load_dotenv
load_dotenv("../../../../../../apis/.env")
api_key = os.getenv("OPENAI_API_KEY")
else:
api_key = os.getenv("OPENAI_API_KEY")
unmasked_chars = 8
masked_key = api_key[:unmasked_chars] + '*' * (len(api_key) - unmasked_chars*2) + api_key[-unmasked_chars:]
print(f"API key: {masked_key}")
def process_cv(job_text, cv_text, req_experience, positions_cap, dist_threshold_low, dist_threshold_high):
if dist_threshold_low >= dist_threshold_high:
return {"error": "dist_threshold_low debe ser más bajo que dist_threshold_high."}
if not isinstance(cv_text, str) or not cv_text.strip():
return {"error": "Por favor, introduce el CV o sube un fichero."}
try:
procesador = ProcesadorCV(api_key, cv_text, job_text, ner_pre_prompt,
system_prompt, user_prompt, ner_schema, response_schema)
dict_respuesta = procesador.procesar_cv_completo(
req_experience=req_experience,
positions_cap=positions_cap,
dist_threshold_low=dist_threshold_low,
dist_threshold_high=dist_threshold_high
)
return dict_respuesta
except Exception as e:
return {"error": f"Error en el procesamiento: {str(e)}"}
# Parámetros de ejecución:
job_text = "Generative AI engineer"
cv_sample_path = 'cv_examples/reddgr_cv.txt' # Ruta al fichero de texto con un currículo de ejemplo
with open(cv_sample_path, 'r', encoding='utf-8') as file:
cv_text = file.read()
# Prompts:
with open('prompts/ner_pre_prompt.txt', 'r', encoding='utf-8') as f:
ner_pre_prompt = f.read()
with open('prompts/system_prompt.txt', 'r', encoding='utf-8') as f:
system_prompt = f.read()
with open('prompts/user_prompt.txt', 'r', encoding='utf-8') as f:
user_prompt = f.read()
# Esquemas JSON:
with open('json/ner_schema.json', 'r', encoding='utf-8') as f:
ner_schema = json.load(f)
with open('json/response_schema.json', 'r', encoding='utf-8') as f:
response_schema = json.load(f)
# Fichero de ejemplo para autocompletar (opción que aparece en la parte de abajo de la interfaz de usuario):
with open('cv_examples/reddgr_cv.txt', 'r', encoding='utf-8') as file:
cv_example = file.read()
default_parameters = [48, 10, 0.5, 0.7] # Parámetros por defecto para el reinicio de la interfaz y los ejemplos predefinidos
# Código CSS para truncar el texto de ejemplo en la interfaz (bloque "Examples" en la parte de abajo):
css = """
table tbody tr {
height: 2.5em; /* Set a fixed height for the rows */
overflow: hidden; /* Hide overflow content */
}
table tbody tr td {
overflow: hidden; /* Ensure content within cells doesn't overflow */
text-overflow: ellipsis; /* Add ellipsis for overflowing text */
white-space: nowrap; /* Prevent text from wrapping */
vertical-align: middle; /* Align text vertically within the fixed height */
}
"""
# Interfaz Gradio:
with gr.Blocks(css=css) as interface:
# Inputs
job_text_input = gr.Textbox(label="Título oferta de trabajo", lines=1, placeholder="Introduce el título de la oferta de trabajo")
cv_text_input = gr.Textbox(label="CV en formato texto", lines=5, max_lines=5, placeholder="Introduce el texto del CV")
# Opciones avanzadas ocultas en un objeto "Accordion"
with gr.Accordion("Opciones avanzadas", open=False):
req_experience_input = gr.Number(label="Experiencia requerida (en meses)", value=default_parameters[0], precision=0)
positions_cap_input = gr.Number(label="Número máximo de puestos a extraer", value=default_parameters[1], precision=0)
dist_threshold_low_slider = gr.Slider(
label="Umbral mínimo de distancia de embeddings (puesto equivalente)",
minimum=0, maximum=1, value=default_parameters[2], step=0.05
)
dist_threshold_high_slider = gr.Slider(
label="Umbral máximo de distancia de embeddings (puesto irrelevante)",
minimum=0, maximum=1, value=default_parameters[3], step=0.05
)
submit_button = gr.Button("Procesar")
clear_button = gr.Button("Limpiar")
output_json = gr.JSON(label="Resultado")
# Ejemplos:
examples = gr.Examples(
examples=[
["Cajero de supermercado", "Trabajo de charcutero desde 2021. Antes trabajé 2 meses de camarero en un bar de tapas."] + default_parameters,
["Generative AI Engineer", cv_example] + default_parameters
],
inputs=[job_text_input, cv_text_input, req_experience_input, positions_cap_input, dist_threshold_low_slider, dist_threshold_high_slider]
)
# Botón "Procesar"
submit_button.click(
fn=process_cv,
inputs=[
job_text_input,
cv_text_input,
req_experience_input,
positions_cap_input,
dist_threshold_low_slider,
dist_threshold_high_slider
],
outputs=output_json
)
# Botón "Limpiar"
clear_button.click(
fn=lambda: ("","",*default_parameters),
inputs=[],
outputs=[
job_text_input,
cv_text_input,
req_experience_input,
positions_cap_input,
dist_threshold_low_slider,
dist_threshold_high_slider
]
)
# Footer
gr.Markdown("""
<footer>
<p>Puedes consultar el código completo de esta app y los notebooks explicativos en
<a href='https://github.com/reddgr/procesador-de-curriculos-cv' target='_blank'>GitHub</a></p>
<p>© 2024 <a href='https://talkingtochatbots.com' target='_blank'>talkingtochatbots.com</a></p>
</footer>
""")
# Lanzar la aplicación:
if __name__ == "__main__":
interface.launch() |