locorene1000 commited on
Commit
191f966
1 Parent(s): 41ceafd
Files changed (1) hide show
  1. app.py +6 -0
app.py CHANGED
@@ -14,6 +14,12 @@ def wait_for_gpu():
14
  # Espera hasta que una GPU est茅 disponible
15
  wait_for_gpu()
16
 
 
 
 
 
 
 
17
  # Configuraci贸n del pipeline con el modelo Meta-Llama usando GPU
18
  pipe = pipeline("text-generation", model="meta-llama/Meta-Llama-3.1-405B-Instruct-FP8", device=0)
19
 
 
14
  # Espera hasta que una GPU est茅 disponible
15
  wait_for_gpu()
16
 
17
+ # Aseg煤rate de que fbgemm-gpu est茅 instalado y se pueda utilizar
18
+ try:
19
+ import fbgemm_gpu
20
+ except ImportError:
21
+ raise ImportError("Necesitas instalar fbgemm-gpu para usar cuantizaci贸n FP8 con este modelo. Por favor, sigue las instrucciones en https://pytorch.org/FBGEMM/fbgemm_gpu-development/InstallationInstructions.html#fbgemm-gpu-install-libraries")
22
+
23
  # Configuraci贸n del pipeline con el modelo Meta-Llama usando GPU
24
  pipe = pipeline("text-generation", model="meta-llama/Meta-Llama-3.1-405B-Instruct-FP8", device=0)
25