Spaces:

cngsm
/

whisper_coqui

Build error

cngsm commited on Nov 28, 2024

Commit

9220224

verified ·

1 Parent(s): 7d5f167

Upload traduzir_audio_com_whisper_coqui.py

Files changed (1) hide show

traduzir_audio_com_whisper_coqui.py ADDED Viewed

+import gradio as gr
+import whisper
+from TTS.api import TTS
+import ffmpeg
+# Função principal
+def process_audio(file):
+    # Salvar o arquivo carregado
+    input_file = "input_audio_or_video.mp4"
+    with open(input_file, "wb") as f:
+        f.write(file.read())
+    # Carregar modelo Whisper
+    model = whisper.load_model("base")
+    # Transcrição e tradução
+    result = model.transcribe(input_file, task="translate", language="pt")
+    translated_text = result['text']
+    # Salvar texto traduzido
+    with open("translated_text.txt", "w") as f:
+        f.write(translated_text)
+    # Gerar áudio traduzido com Coqui TTS
+    tts = TTS(model_name="tts_models/pt-cv-vits", progress_bar=False)
+    output_audio = "translated_audio.wav"
+    tts.tts_to_file(text=translated_text, file_path=output_audio)
+    return translated_text, output_audio
+# Interface Gradio
+iface = gr.Interface(
+    fn=process_audio,
+    inputs=gr.Audio(source="upload", type="file"),
+    outputs=[
+        gr.Textbox(label="Texto traduzido"),
+        gr.Audio(label="Áudio traduzido")
+    ],
+    title="Traduzir Áudio/Vídeo com Whisper e Coqui TTS",
+    description="Carregue um arquivo de áudio ou vídeo para transcrição e tradução para português, com geração de áudio traduzido."
+)
+# Iniciar a interface
+iface.launch()