Spaces:

StevenChen16
/

WhisperX-V2

Sleeping

StevenChen16 commited on Nov 13, 2024

Commit

69b1e14

1 Parent(s): f13acc2

first update

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,7 +1,23 @@
 import gradio as gr
-def greet(name):
-    return "Hello " + name + "!!"
-demo = gr.Interface(fn=greet, inputs="text", outputs="text")
-demo.launch()

 import gradio as gr
+import whisperx
+import whisper
+def transcribe(audio_file):
+    device = "cuda" if torch.cuda.is_available() else "cpu"
+    # Transcribe with original Whisper
+    model = whisper.load_model("large", device)
+    result = model.transcribe(audio_file)
+    # Load alignment model and metadata
+    model_a, metadata = whisperx.load_align_model(language_code=result["language"], device=device)
+    # Align Whisper output
+    result_aligned = whisperx.align(result["segments"], model_a, metadata, audio_file, device)
+    return {"aligned": result_aligned["segments"], "word_segments": result_aligned["word_segments"]}
+inputs = gr.inputs.Audio(source="upload", type="filepath")
+outputs = gr.outputs.JSON()
+gr.Interface(fn=transcribe, inputs=inputs, outputs=outputs).launch()

requirements.txt ADDED Viewed


1	+ gradio
2	+ git+https://github.com/m-bain/whisperx.git