cngsm commited on
Commit
9220224
·
verified ·
1 Parent(s): 7d5f167

Upload traduzir_audio_com_whisper_coqui.py

Browse files
Files changed (1) hide show
  1. traduzir_audio_com_whisper_coqui.py +44 -0
traduzir_audio_com_whisper_coqui.py ADDED
@@ -0,0 +1,44 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import gradio as gr
2
+ import whisper
3
+ from TTS.api import TTS
4
+ import ffmpeg
5
+
6
+ # Função principal
7
+ def process_audio(file):
8
+ # Salvar o arquivo carregado
9
+ input_file = "input_audio_or_video.mp4"
10
+ with open(input_file, "wb") as f:
11
+ f.write(file.read())
12
+
13
+ # Carregar modelo Whisper
14
+ model = whisper.load_model("base")
15
+
16
+ # Transcrição e tradução
17
+ result = model.transcribe(input_file, task="translate", language="pt")
18
+ translated_text = result['text']
19
+
20
+ # Salvar texto traduzido
21
+ with open("translated_text.txt", "w") as f:
22
+ f.write(translated_text)
23
+
24
+ # Gerar áudio traduzido com Coqui TTS
25
+ tts = TTS(model_name="tts_models/pt-cv-vits", progress_bar=False)
26
+ output_audio = "translated_audio.wav"
27
+ tts.tts_to_file(text=translated_text, file_path=output_audio)
28
+
29
+ return translated_text, output_audio
30
+
31
+ # Interface Gradio
32
+ iface = gr.Interface(
33
+ fn=process_audio,
34
+ inputs=gr.Audio(source="upload", type="file"),
35
+ outputs=[
36
+ gr.Textbox(label="Texto traduzido"),
37
+ gr.Audio(label="Áudio traduzido")
38
+ ],
39
+ title="Traduzir Áudio/Vídeo com Whisper e Coqui TTS",
40
+ description="Carregue um arquivo de áudio ou vídeo para transcrição e tradução para português, com geração de áudio traduzido."
41
+ )
42
+
43
+ # Iniciar a interface
44
+ iface.launch()