Spaces:

locorene1000
/

ebeber

Sleeping

App Files Files Community

locorene1000 commited on Jul 28, 2024

Commit

c59c044

1 Parent(s): c6f8a91

a

Browse files

Files changed (1) hide show

app.py +15 -9

app.py CHANGED Viewed

@@ -1,12 +1,11 @@
 import gradio as gr
 import torch
-from awq import AutoAWQForCausalLM
-from transformers import AutoTokenizer
 import spaces
 class Modelo:
     def __init__(self):
-        self.model_id = "hugging-quants/Meta-Llama-3.1-70B-Instruct-AWQ-INT4"
         self.tokenizer = None
         self.model = None
         self.instrucciones = """
@@ -14,20 +13,27 @@ class Modelo:
 Como Ministro de la Corte Suprema de Chile, su objetivo es mejorar y finalizar los borradores de resoluciones judiciales para el sistema judicial civil del país...
 """
-        self.cargar_modelo_y_tokenizador()  # Llama a la función para inicializar el modelo y el tokenizador
     def cargar_modelo_y_tokenizador(self):
         if not torch.cuda.is_available():
             raise Exception("No hay GPU disponible")
         self.tokenizer = AutoTokenizer.from_pretrained(self.model_id)
-        self.model = AutoAWQForCausalLM.from_pretrained(
             self.model_id,
-            torch_dtype=torch.float16,
-            device_map={"": "cuda:0"},  # Forzar la carga en GPU
             low_cpu_mem_usage=True
         )
     def mejorar_resolucion(self, message, history=None):
         prompt = [
             {"role": "system", "content": self.instrucciones},
             {"role": "user", "content": f"Mejora esta resolución judicial: {message}"}
@@ -47,4 +53,4 @@ modelo = Modelo()
 with gr.Blocks() as demo:
     chatbot = gr.ChatInterface(fn=modelo.mejorar_resolucion, title="Mejora de Resoluciones Judiciales")
-    demo.launch()

 import gradio as gr
 import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
 import spaces
 class Modelo:
     def __init__(self):
+        self.model_id = "mistralai/Mistral-Nemo-Instruct-2407"
         self.tokenizer = None
         self.model = None
         self.instrucciones = """
 Como Ministro de la Corte Suprema de Chile, su objetivo es mejorar y finalizar los borradores de resoluciones judiciales para el sistema judicial civil del país...
 """
+    @spaces.GPU(duration=120)
     def cargar_modelo_y_tokenizador(self):
         if not torch.cuda.is_available():
             raise Exception("No hay GPU disponible")
         self.tokenizer = AutoTokenizer.from_pretrained(self.model_id)
+        self.model = AutoModelForCausalLM.from_pretrained(
             self.model_id,
+            torch_dtype=torch.bfloat16,  # Utiliza BF16 para ahorrar memoria
+            device_map="auto",  # Asigna automáticamente en función de los recursos disponibles
             low_cpu_mem_usage=True
         )
+        self.model.to("cuda")  # Mover explícitamente el modelo a la GPU si es posible
+    @spaces.GPU(duration=120)
     def mejorar_resolucion(self, message, history=None):
+        if self.model is None or self.tokenizer is None:
+            self.cargar_modelo_y_tokenizador()
         prompt = [
             {"role": "system", "content": self.instrucciones},
             {"role": "user", "content": f"Mejora esta resolución judicial: {message}"}
 with gr.Blocks() as demo:
     chatbot = gr.ChatInterface(fn=modelo.mejorar_resolucion, title="Mejora de Resoluciones Judiciales")
+    demo.launch()