Spaces:

nia2
/

cozi

Build error

App Files Files Community

nia2 commited on Sep 19, 2024

Commit

1c0ebe4

verified ·

1 Parent(s): 655b3e9

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -12

app.py CHANGED Viewed

@@ -3,25 +3,32 @@ import google.generativeai as genai
 from yolov5 import YOLOv5
 from PIL import Image
 from transformers import AutoProcessor, BarkModel
-#Clé Api
 genai.configure(api_key="AIzaSyB_Hnl_77gd1I8xs6iuLqKIoGHgsZMXm1M")
 # Le modèle Gemini Pro
 gemini_model = genai.GenerativeModel('gemini-pro')
 # Le modèle de détection YOLOv5
 yolo_model_path = "yolov5s.pt"
-yolo_model = YOLOv5(yolo_model_path, device="cpu")
 # Modèle Bark
 processor = AutoProcessor.from_pretrained("suno/bark")
 model = BarkModel.from_pretrained("suno/bark")
 # Détection d'ingrédients
 def detect_ingredients(image):
     results = yolo_model.predict(image)
     ingredients = results.pandas().xyxy[0]['name'].tolist()
     return ingredients
@@ -54,20 +61,22 @@ def generate_recipe(ingredients):
     response = gemini_model.generate_content(prompt)
     return response.text
 # Interface Gradio
 def process_image(image):
-        image = Image.open(image)
-        ingredients = detect_ingredients(image)
-        recipe = generate_recipe(ingredients)
-        return f"Ingrédients détectés : {', '.join(ingredients)}\n\nRecette générée :\n{recipe}"
 # Fonction pour générer de l'audio avec le modèle Bark
 def generate_audio(text):
     inputs = processor(text=text, return_tensors="pt")
     audio_output = model.generate(**inputs)
-    return audio_output
 # Mise à jour de l'interface Gradio
 iface = gr.Interface(
@@ -77,6 +86,7 @@ iface = gr.Interface(
     title="Générateur de Recettes par Ingrédients",
     description="Téléchargez une image d'ingrédients pour générer une recette.",
 )
 # Interface Gradio pour générer de l'audio
 audio_iface = gr.Interface(
     fn=generate_audio,
@@ -89,4 +99,4 @@ audio_iface = gr.Interface(
 # Pour lancer l'application
 if __name__ == "__main__":
     iface.launch()
-    audio_iface.launch()

 from yolov5 import YOLOv5
 from PIL import Image
 from transformers import AutoProcessor, BarkModel
+import torch
+import soundfile as sf
+import tempfile
+# Clé API
 genai.configure(api_key="AIzaSyB_Hnl_77gd1I8xs6iuLqKIoGHgsZMXm1M")
 # Le modèle Gemini Pro
 gemini_model = genai.GenerativeModel('gemini-pro')
 # Le modèle de détection YOLOv5
 yolo_model_path = "yolov5s.pt"
+try:
+    yolo_model = YOLOv5(yolo_model_path, device="cpu")
+except Exception as e:
+    print(f"Erreur lors du chargement du modèle YOLOv5 : {e}")
+    yolo_model = None
 # Modèle Bark
 processor = AutoProcessor.from_pretrained("suno/bark")
 model = BarkModel.from_pretrained("suno/bark")
 # Détection d'ingrédients
 def detect_ingredients(image):
+    if yolo_model is None:
+        return []
     results = yolo_model.predict(image)
     ingredients = results.pandas().xyxy[0]['name'].tolist()
     return ingredients
     response = gemini_model.generate_content(prompt)
     return response.text
 # Interface Gradio
 def process_image(image):
+    image = Image.open(image)
+    ingredients = detect_ingredients(image)
+    recipe = generate_recipe(ingredients)
+    return f"Ingrédients détectés : {', '.join(ingredients)}\n\nRecette générée :\n{recipe}"
 # Fonction pour générer de l'audio avec le modèle Bark
 def generate_audio(text):
     inputs = processor(text=text, return_tensors="pt")
     audio_output = model.generate(**inputs)
+    # Enregistrer l'audio dans un fichier temporaire
+    with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as temp_audio_file:
+        sf.write(temp_audio_file.name, audio_output.numpy(), samplerate=16000)
+        return temp_audio_file.name
 # Mise à jour de l'interface Gradio
 iface = gr.Interface(
     title="Générateur de Recettes par Ingrédients",
     description="Téléchargez une image d'ingrédients pour générer une recette.",
 )
 # Interface Gradio pour générer de l'audio
 audio_iface = gr.Interface(
     fn=generate_audio,
 # Pour lancer l'application
 if __name__ == "__main__":
     iface.launch()
+    audio_iface.launch()