Chichewa-Automatic-Transcription

Runtime error

App Files Files Community

framajawa

dmatekenya commited on Jul 13, 2023

Commit

3564020

•

0 Parent(s):

Duplicate from dmatekenya/Chichewa-Automatic-Transcription

Browse files

Co-authored-by: Dunstan Matekenya <dmatekenya@users.noreply.huggingface.co>

Files changed (4) hide show

.gitattributes +35 -0
README.md +14 -0
app.py +60 -0
requirements.txt +3 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,14 @@

+---
+title: Chichewa Automatic Transcription
+emoji: ⚡
+colorFrom: pink
+colorTo: pink
+sdk: gradio
+sdk_version: 3.35.2
+app_file: app.py
+pinned: false
+license: openrail
+duplicated_from: dmatekenya/Chichewa-Automatic-Transcription
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,60 @@

+from transformers import pipeline
+from transformers import WhisperForConditionalGeneration, WhisperProcessor, WhisperFeatureExtractor
+import gradio as gr
+import librosa
+# Prepare model for prediction
+MODEL_SPECS_ID = "dmatekenya/whisper-small_finetuned_sh_chich"
+MODEL_SPECS_BASE_ID = "openai/whisper-small"
+MODEL_SPECS_BASE_LAN_SW = "swahili"
+MODEL_SPECS_BASE_LAN_SH = "shona"
+FEATURE_EXTRACTOR = WhisperFeatureExtractor.from_pretrained(MODEL_SPECS_ID)
+PROCESSOR_SH = WhisperProcessor.from_pretrained(MODEL_SPECS_BASE_ID,
+                                                language=MODEL_SPECS_BASE_LAN_SH, task="transcribe")
+MODEL = WhisperForConditionalGeneration.from_pretrained(MODEL_SPECS_ID)
+def transcribe(audio_file):
+  y, sr = librosa.load(audio_file, sr=16000)
+  input_features = PROCESSOR_SH(y, return_tensors="pt", sampling_rate=sr).input_features
+  generated_ids = MODEL.generate(inputs=input_features)
+  transcription = PROCESSOR_SH.batch_decode(generated_ids, skip_special_tokens=True)[0]
+  return transcription
+def transcribe_audio(mic=None, file=None):
+    if mic is not None:
+        audio = mic
+    elif file is not None:
+        audio = file
+    else:
+        return "You must either provide a mic recording or a file"
+    transcription = transcribe(audio_file=audio)
+    return transcription
+title = "Transcribe Chichewa Audio"
+description = """
+<img src="https://i.ibb.co/5nQdGSs/logo.png">
+IN THIS DEMO, TEST THE FIRST AUTOMATED SPEECH RECOGNITION (ASR) MODEL FOR CHICHEWA BY TRANSCRIBING YOUR CHICHEWA VOICE NOTES.
+FOR AUDIO FILES, PLEASE UPLOAD SHORT VOICE NOTES ONLY (NO LONGER THAN 30 SEC).
+"""
+article = "Read more about the [ChichewaSpeech2Text](https://dmatekenya.github.io/Chichewa-Speech2Text/README.html) project \
+and make sure to sign-up for our first [voice note donation event](https://forms.gle/fHLESutofVvb2YFM9) on July 22. \
+You stand a chance to win Airtel or TNM units if you choose to participate in the raffle after the event"
+gr.Interface(
+    fn=transcribe_audio,
+    theme='grass',
+    title=title,
+    description=description,
+    article=article,
+    inputs=[
+        gr.Audio(source="microphone", type="filepath", optional=True),
+        gr.Audio(source="upload", type="filepath", optional=True),
+    ],
+    outputs="text",
+).launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+transformers
+librosa
+torch