Spaces:

WillHeld
/

diva-audio-chat

Sleeping

Helw150 commited on Oct 11, 2024

Commit

7b1b100

1 Parent(s): 809dcd8

Add Duration

Files changed (1) hide show

app.py CHANGED Viewed

@@ -24,7 +24,7 @@ diva_model = AutoModel.from_pretrained(
 resampler = Audio(sampling_rate=16_000)
-@spaces.GPU
 @torch.no_grad
 def diva_audio(audio_input, do_sample=False, temperature=0.001, prev_outs=None):
     sr, y = audio_input
@@ -116,8 +116,10 @@ def process_audio(audio: tuple, state: AppState):
     if state.stream is None:
         state.stream = audio[1]
         state.sampling_rate = audio[0]
-    else:
         state.stream = np.concatenate((state.stream, audio[1]))
     pause_detected = determine_pause(state.stream, state.sampling_rate, state)
     state.pause_detected = pause_detected
@@ -190,8 +192,8 @@ with gr.Blocks(theme=theme) as demo:
         process_audio,
         [input_audio, state],
         [input_audio, state],
-        stream_every=0.50,
-        time_limit=30,
     )
     respond = input_audio.stop_recording(response, [state], [state, chatbot])
     respond.then(start_recording_user, [state], [input_audio])
@@ -205,4 +207,4 @@ with gr.Blocks(theme=theme) as demo:
     )
-demo.launch(share=True)

 resampler = Audio(sampling_rate=16_000)
+@spaces.GPU(duration=20)
 @torch.no_grad
 def diva_audio(audio_input, do_sample=False, temperature=0.001, prev_outs=None):
     sr, y = audio_input
     if state.stream is None:
         state.stream = audio[1]
         state.sampling_rate = audio[0]
+    elif audio is not None and audio[1] is not None:
         state.stream = np.concatenate((state.stream, audio[1]))
+    else:
+        return None, state
     pause_detected = determine_pause(state.stream, state.sampling_rate, state)
     state.pause_detected = pause_detected
         process_audio,
         [input_audio, state],
         [input_audio, state],
+        stream_every=0.25,
+        time_limit=10,
     )
     respond = input_audio.stop_recording(response, [state], [state, chatbot])
     respond.then(start_recording_user, [state], [input_audio])
     )
+demo.launch()