discrete_speech

community

https://www.wavlab.org/activities/2024/Interspeech2024-Discrete-Speech-Unit-Challenge/

AI & ML interests

Speech and Audio Processing

Recent Activity

ftshijt authored a paper 4 months ago

ESPnet-EZ: Python-only ESPnet for Easy Fine-tuning and Integration

ftshijt updated a dataset 5 months ago

discrete-speech/interspeech2024_discrete_speech_svs_results

ftshijt updated a Space 5 months ago

discrete-speech/interspeech2024_discrete_speech_svs

View all activity

discrete-speech's activity

ftshijt

authored a paper 4 months ago

ESPnet-EZ: Python-only ESPnet for Easy Fine-tuning and Integration

Paper • 2409.09506 • Published Sep 14, 2024 • 4

ftshijt

updated a dataset 5 months ago

discrete-speech/interspeech2024_discrete_speech_svs_results

Viewer • Updated Aug 23, 2024 • 8 • 10

ftshijt

updated a Space 5 months ago

Leaderboard for SVS track

sw005320

authored a paper 6 months ago

Towards Robust Speech Representation Learning for Thousands of Languages

Paper • 2407.00837 • Published Jun 30, 2024 • 10

simpleoier

authored a paper 6 months ago

Towards Robust Speech Representation Learning for Thousands of Languages

Paper • 2407.00837 • Published Jun 30, 2024 • 10

ftshijt

updated 2 datasets 10 months ago

discrete-speech/interspeech2024_discrete_speech_tts_results

Viewer • Updated Mar 22, 2024 • 10 • 10

discrete-speech/interspeech2024_discrete_speech_tts_1h_results

Viewer • Updated Mar 22, 2024 • 8 • 7

ftshijt

updated 4 Spaces 10 months ago

Leaderboard for TTS (Acoustic+Vocoder) track

Leaderboard for TTS (Acoustic+Vocoder) 1Hour track

Leaderboard for TTS (Vocoder-HighSR) track

Leaderboard for TTS (Vocoder-LowSR) track

ftshijt

updated a dataset 10 months ago

discrete-speech/interspeech2024_discrete_speech_vocoder_results

Preview • Updated Mar 18, 2024 • 36

simpleoier

updated a dataset 10 months ago

discrete-speech/interspeech2024_discrete_speech_asr_results

Viewer • Updated Mar 17, 2024 • 13 • 31

simpleoier

updated a Space 10 months ago

Leaderboard for ASR track

ftshijt

updated a dataset 10 months ago

discrete-speech/interspeech2024_discrete_speech_vocoder_requests

Updated Feb 28, 2024 • 2

simpleoier

updated a dataset 10 months ago

discrete-speech/interspeech2024_discrete_speech_asr_requests

Updated Feb 27, 2024 • 3

ftshijt

updated a dataset 11 months ago

discrete-speech/interspeech2024_discrete_speech_tts_requests

Updated Feb 21, 2024 • 12

sw005320

authored a paper 11 months ago

OWSM v3.1: Better and Faster Open Whisper-Style Speech Models based on E-Branchformer

Paper • 2401.16658 • Published Jan 30, 2024 • 13

simpleoier

authored a paper 11 months ago

OWSM v3.1: Better and Faster Open Whisper-Style Speech Models based on E-Branchformer

Paper • 2401.16658 • Published Jan 30, 2024 • 13

sw005320

authored a paper about 1 year ago

Music ControlNet: Multiple Time-varying Controls for Music Generation

Paper • 2311.07069 • Published Nov 13, 2023 • 43