PROYECTO_2024

Sleeping

C2MV commited on Sep 21, 2024

Commit

f2e3b2e

verified ·

1 Parent(s): 11daf1f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -15,31 +15,31 @@ tokenizer, yi_coder_model, yi_coder_device = load_yi_coder_model()
 # Conectar a Pinecone
 index = connect_to_pinecone()
-# Función para generar código utilizando Yi-Coder
 @gpu_decorator(duration=100)
 def generate_code(system_prompt, user_prompt, max_length):
     device = yi_coder_device
     model = yi_coder_model
-    tokenizer_ = tokenizer  # Ya lo tenemos cargado
-    messages = [
-        {"role": "system", "content": system_prompt},
-        {"role": "user", "content": user_prompt}
-    ]
-    # Preparamos el input para el modelo
-    prompt = system_prompt + "\n" + user_prompt
     model_inputs = tokenizer_(prompt, return_tensors="pt").to(device)
     with torch.no_grad():
         generated_ids = model.generate(
             model_inputs.input_ids,
             max_new_tokens=max_length,
-            eos_token_id=tokenizer_.eos_token_id
         )
-    # Extraer solo la parte generada
     generated_text = tokenizer_.batch_decode(generated_ids, skip_special_tokens=True)[0]
     response = generated_text[len(prompt):].strip()
     return response

 # Conectar a Pinecone
 index = connect_to_pinecone()
+# Función para generar código con Yi-Coder
 @gpu_decorator(duration=100)
 def generate_code(system_prompt, user_prompt, max_length):
     device = yi_coder_device
     model = yi_coder_model
+    tokenizer_ = tokenizer
+    # Combina el system_prompt y user_prompt sin formato de chat
+    prompt = f"{system_prompt}\n{user_prompt}"
+    # Tokeniza el prompt
     model_inputs = tokenizer_(prompt, return_tensors="pt").to(device)
     with torch.no_grad():
+        # Genera la respuesta
         generated_ids = model.generate(
             model_inputs.input_ids,
             max_new_tokens=max_length,
+            eos_token_id=tokenizer_.eos_token_id
         )
+    # Decodifica el texto generado
     generated_text = tokenizer_.batch_decode(generated_ids, skip_special_tokens=True)[0]
+    # Extrae solo la parte generada después del prompt inicial
     response = generated_text[len(prompt):].strip()
     return response