Spaces:

truongghieu
/

voice_regconition

Sleeping

truongghieu commited on Dec 10, 2023

Commit

3f8ba92

•

1 Parent(s): ea316fd

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,7 +5,13 @@ import numpy as np
 def recognize_speech(audio_data):
     # nontype to wav
-    audio_data = sr.AudioData(np.array(audio_data[1]), 16000, 2)
     recognizer = sr.Recognizer()
     try:
@@ -16,6 +22,7 @@ def recognize_speech(audio_data):
     except sr.RequestError as e:
         return f"Could not request results from Google Speech Recognition service; {e}"
-iface = gr.Interface(fn=recognize_speech, inputs="microphone", outputs="text")
 iface.launch()

 def recognize_speech(audio_data):
     # nontype to wav
+    # tuple(sample_rate, numpy array)
+    # get numpy array
+    # get sample rate
+    # convert to AudioData
+    # recognize speech
+    # return text
+    audio_data = sr.AudioData(np.array(audio_data[1]), sample_rate=audio_data[0] , sample_width=2)
     recognizer = sr.Recognizer()
     try:
     except sr.RequestError as e:
         return f"Could not request results from Google Speech Recognition service; {e}"
+audio_input = gr.Audio(source="microphone", type="numpy", sample_rate=16000)
+iface = gr.Interface(fn=recognize_speech, inputs=audio_input , outputs="text")
 iface.launch()