Spaces:

BenDaouda
/

ASR_Audio_to_wolof

Runtime error

BenDaouda commited on Apr 20, 2023

Commit

5f34871

•

1 Parent(s): 314bad3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,15 +1,22 @@
 import gradio as gr
-title = "wolof_ASR"
-description = "Wolof ASR"
-iface = gr.Interface.load(
-    "BenDaouda/wav2vec2-large-xls-r-300m-wolof-test-coloab",
-    inputs=gr.Audio(source="microphone", type="filepath"),
-    outputs="text",
-    title=title,
-    description=description,
-    enable_queue=True
 )
 iface.launch()

+from transformers import AutoModelForCTC, Wav2Vec2Tokenizer
+import torch
 import gradio as gr
+model = Wav2Vec2ForCTC.from_pretrained("BenDaouda/wav2vec2-large-xls-r-300m-wolof-test-coloab")
+processor = Wav2Vec2Processor.from_pretrained("BenDaouda/wav2vec2-large-xls-r-300m-wolof-test-coloab")
+def transcribe(audio):
+    input_values = tokenizer(audio, return_tensors="pt").input_values
+    with torch.no_grad():
+        logits = model(input_values).logits
+    predicted_ids = torch.argmax(logits, dim=-1)
+    transcription = tokenizer.batch_decode(predicted_ids)[0]
+    return transcription
+iface = gr.Interface(
+    fn=transcribe,
+    inputs=gr.inputs.Audio(source="microphone", type="file", resample_to=16000),
+    outputs="text"
 )
 iface.launch()