Spaces:

locorene1000
/

ebeber

Sleeping

App Files Files Community

locorene1000 commited on Jul 31, 2024

Commit

ac8a2b6

verified ·

1 Parent(s): f349076

A

Browse files

Files changed (1) hide show

app.py +53 -10

app.py CHANGED Viewed

@@ -3,6 +3,7 @@ import torch
 from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
 import spaces
 # Instrucciones específicas para el modelo
 instrucciones = """
@@ -69,23 +70,65 @@ model = AutoModelForCausalLM.from_pretrained(
     device_map="auto" if device == "cuda" else None
 )
-@spaces.GPU(duration=120)
-def mejorar_resolucion(input_text):
-    # Construcción del prompt con instrucciones y entrada del usuario
-    prompt = f"{instrucciones}\n\n{input_text}"
-    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True, max_length=512).to(device)
-    attention_mask = inputs['attention_mask']
     outputs = model.generate(
         inputs.input_ids,
-        attention_mask=attention_mask,
-        max_new_tokens=128,  # Ajusta a 128 para una salida más rápida
-        temperature=0.3,  # Recomendado para Mistral Nemo
         do_sample=True,
         pad_token_id=tokenizer.pad_token_id
     )
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return response
 # Definición de la interfaz de Gradio
 with gr.Blocks() as demo:

 from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
 import spaces
+import re
 # Instrucciones específicas para el modelo
 instrucciones = """
     device_map="auto" if device == "cuda" else None
 )
+def construir_prompt(input_text):
+    return f"""
+{instrucciones}
+Texto original a mejorar:
+{input_text}
+Versión mejorada y finalizada de la resolución judicial:
+"""
+def post_procesar_resolucion(texto):
+    secciones = ['VISTOS:', 'CONSIDERANDO:', 'SE RESUELVE:']
+    for seccion in secciones:
+        if seccion not in texto:
+            texto = f"{seccion}\n\n{texto}"
+    texto = re.sub(r'(\d+)°', r'\1º', texto)
+    texto = re.sub(r'([IVX]+\.)', r'\n\1', texto)
+    return texto
+def validar_resolucion(texto):
+    requisitos = [
+        ('VISTOS:', "La sección 'VISTOS:' es obligatoria"),
+        ('CONSIDERANDO:', "La sección 'CONSIDERANDO:' es obligatoria"),
+        ('SE RESUELVE:', "La sección 'SE RESUELVE:' es obligatoria"),
+        (r'\d+º', "Debe contener al menos un punto numerado"),
+        (r'[IVX]+\.', "Debe contener al menos un punto resolutivo romano")
+    ]
+    errores = []
+    for patron, mensaje in requisitos:
+        if not re.search(patron, texto):
+            errores.append(mensaje)
+    return errores
+def mejorar_resolucion(input_text):
+    prompt = construir_prompt(input_text)
+    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True, max_length=1024).to(device)
     outputs = model.generate(
         inputs.input_ids,
+        attention_mask=inputs['attention_mask'],
+        max_new_tokens=512,
+        temperature=0.7,
         do_sample=True,
+        num_return_sequences=1,
         pad_token_id=tokenizer.pad_token_id
     )
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    texto_mejorado = post_procesar_resolucion(response.split("Versión mejorada y finalizada de la resolución judicial:")[-1].strip())
+    errores = validar_resolucion(texto_mejorado)
+    if errores:
+        return f"La resolución generada no cumple con los siguientes requisitos:\n" + "\n".join(errores)
+    return texto_mejorado
 # Definición de la interfaz de Gradio
 with gr.Blocks() as demo: