WhisperSpeech

Runtime error

jpc commited on Feb 26, 2024

Commit

ae73f04

verified ·

1 Parent(s): e315c05

Fixed stoks padding

This fixes the strange vocalizations at the end of many generations

Files changed (1) hide show

app.py CHANGED Viewed

@@ -80,7 +80,8 @@ def generate_audio(pipe, segments, speaker, speaker_url, cps=14):
     else: speaker = pipe.default_speaker
     langs, texts = [list(x) for x in zip(*segments)]
     print(texts, langs)
-    stoks = pipe.t2s.generate(texts, cps=cps, lang=langs)[0]
     atoks = pipe.s2a.generate(stoks, speaker.unsqueeze(0))
     audio = pipe.vocoder.decode(atoks)
     return audio.cpu()

     else: speaker = pipe.default_speaker
     langs, texts = [list(x) for x in zip(*segments)]
     print(texts, langs)
+    stoks = pipe.t2s.generate(texts, cps=cps, lang=langs)
+    stoks = stoks[stoks!=512]
     atoks = pipe.s2a.generate(stoks, speaker.unsqueeze(0))
     audio = pipe.vocoder.decode(atoks)
     return audio.cpu()