Voice_Assistant_TTS_long

Sleeping

Siddhant commited on 23 days ago

Commit

55d576a

•

1 Parent(s): 526631a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -166,6 +166,7 @@ def transcribe(stream, new_chunk):
     global audio_output
     global vad_output
     audio_int16 = np.frombuffer(y, dtype=np.int16)
     audio_float32 = int2float(audio_int16)
     audio_float32=librosa.resample(audio_float32, orig_sr=sr, target_sr=16000)
@@ -185,7 +186,7 @@ def transcribe(stream, new_chunk):
         vad.set_mode(3)
         if (vad.is_speech(y[i*960:(i+1)*960].tobytes(), orig_sr)):
             vad_count+=1
-    if vad_count>10:
         vad_curr=True
         if vad_output is None:
             vad_output=[torch.from_numpy(audio_float32)]

     global audio_output
     global vad_output
+    orig_sr=sr
     audio_int16 = np.frombuffer(y, dtype=np.int16)
     audio_float32 = int2float(audio_int16)
     audio_float32=librosa.resample(audio_float32, orig_sr=sr, target_sr=16000)
         vad.set_mode(3)
         if (vad.is_speech(y[i*960:(i+1)*960].tobytes(), orig_sr)):
             vad_count+=1
+    if vad_count>5:
         vad_curr=True
         if vad_output is None:
             vad_output=[torch.from_numpy(audio_float32)]