Spaces:

tomaseo2022
/

Voz-a-Texto

Running

App Files Files Community

tomaseo2022 commited on Nov 12, 2023

Commit

d6e7a74

1 Parent(s): e5fc112

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -66

app.py CHANGED Viewed

@@ -1,78 +1,22 @@
-import os
-os.system('/usr/local/bin/python -m pip install --upgrade pip')
-os.system("pip install git+https://github.com/openai/whisper.git")
-os.system("pip install gradio --upgrade")
 import gradio as gr
 import whisper
-from share_btn import community_icon_html, loading_icon_html, share_js
 model = whisper.load_model("small")
 def inference(audio):
-    audio = whisper.load_audio(audio)
-    audio = whisper.pad_or_trim(audio)
-    mel = whisper.log_mel_spectrogram(audio).to(model.device)
-    _, probs = model.detect_language(mel)
-    options = whisper.DecodingOptions(fp16 = False)
-    result = whisper.decode(model, mel, options)
-    print(result.text)
-    return result.text, gr.update(visible=True), gr.update(visible=True), gr.update(visible=True)
-css = "footer {visibility: hidden}"
-block = gr.Blocks(css=css)
-with block:
-    gr.HTML(
-       """
-           <div style="text-align: center; max-width: 650px; margin: 0 auto;">
-             <div
-               style="
-                 display: inline-flex;
-                 align-items: center;
-                 gap: 0.8rem;
-                 font-size: 1.75rem;
-               "
-             >
-               <h1 style="font-weight: 900; margin-bottom: 7px;">
-               </h1>
-             </div>
-           </div>
-       """
-    )
     with gr.Group():
         with gr.Box():
             with gr.Row().style(mobile_collapse=False, equal_height=True):
-                audio = gr.Audio(
-                    label="Input Audio",
-                    show_label=False,
-                    source="microphone",
-                    type="filepath"
-                )
-                btn = gr.Button("Transcribir")
-        text = gr.Textbox(show_label=False, elem_id="result-textarea")
-        with gr.Group(elem_id="share-btn-container"):
-            loading_icon = gr.HTML(loading_icon_html, visible=False)
-        btn.click(inference, inputs=[audio], outputs=[text, loading_icon])
-block.launch()

 import gradio as gr
 import whisper
+# Cargar el modelo Whisper
 model = whisper.load_model("small")
 def inference(audio):
+    result = model.transcribe(audio)
+    return result["text"]
+# Crear la interfaz de Gradio
+with gr.Blocks() as block:
     with gr.Group():
         with gr.Box():
             with gr.Row().style(mobile_collapse=False, equal_height=True):
+                audio_input = gr.Audio(label="Input Audio", source="microphone", type="filepath")
+                transcribe_button = gr.Button("Transcribir")
+        transcription_output = gr.Textbox(label="Transcription")
+    transcribe_button.click(inference, inputs=[audio_input], outputs=[transcription_output])
+block.launch()