Spaces for Audio / Voices

John6666 's Collections

Papers

Spaces for Games / Entertainments

Spaces for Tagger / Captioner / Prompter

Spaces for Text-to-images (SDXL, Pony, SD1.5, Flux,...)

Spaces for Audio / Voices

Spaces for Generative-AI Chats

Resources for Tagging / Captioning / Prompting / LLM

My Bookmarks

Spaces for Image Upscaler / Upsampler / Resizer

LoRAs / Models (SDXL1.0, Pony, SD1.5, Flux, ...)

Spaces for Model / Space / useful Utilities in Hugging Face

Resources for Sound Processing

Spaces for LLM / VLM / NLP

Spaces for Image-to-Image / Video

日本語スペース (Spaces in Japanese language)

Gradio Themes

updated about 11 hours ago

Upvote

Running on Zero

384

384

AICoverGen

🚀

Run image generation web UI
Running on Zero

19

19

SBV2 Chupa Demo

👅

Generate sexual voice sounds from text
Running

3

3

VisualNovel_sbv_demo

😊

Generate voice from text with style
Running on CPU Upgrade

621

621

Moe TTS

😊

Generate and convert speech using text and audio inputs
Running

6

6

Bert-VITS2 AI Abe&Suga&Kishida

🏺

Generate speech from text
Running

42

42

AICoverGen

🚀

Launch a web interface for text generation
Build error

13

13

rvc-Blue-archives-hoyogames

:
Running

44

44

VTuber RVC Models

▶

Convert audio to different voices
Running

367

367

RVC Inference HF

👀

Combine and process audio files
Running on Zero

258

258

Audio🔹Separator

🏃

Vocal and background audio separator
Running

47

47

BlueArchiveTTS

📉

Generate audio from text using a voice synthesis model
Running

141

141

Multi Voice TTS(English/Chinese/Japanese)

😆

[中文/English/日本語]multilingual text-to-speech
Running on Zero

405

405

Stable Audio Open Zero

🔥

Generate audio from text prompts
Running

157

157

Applio

🍏

A simple, high-quality voice conversion tool
Running on Zero

1.83k

1.83k

Voice Clone

🗣

Clone voice to say text
Running on Zero

170

170

RVC⚡ZERO

⚡

Voice conversion framework based on VITS
Running

8

8

Multilingual Anime TTS

🎙

Generate anime character voice from text
Runtime error

1

1

DiffSinger🎶 Diffusion for Singing Voice Synthesis

🎶
Running

135

135

Ultimate Vocal Remover WebUI

🎵

Launch a web-based user interface
Running

241

241

Aesthetic RVC Inference HF

🍏

Install dependencies and start an audio application
Running

71

71

Advanced RVC Inference

⚡

Download and prepare voice conversion models
Runtime error

793

793

Vits Models

🏃

Generate audio from text using voice synthesis
Running

525

525

Multilingual Anime TTS

🎙

Generate anime character speech from text
Running

32

32

LoveLive-ShojoKageki VITS

⚡

Generate audio from text using selected speaker and language
Running

365

365

vits-uma-genshin-honkai

🐨

Generate audio from text using VITS
Running

3

3

おしゃべり晋さんメーカー（Style-Bert-VITS2）

🏺

Generate Japanese speech from text
Running

14

14

Hololive Style-Bert-VITS2

😊

Generate speech from text using various voice models
Running on Zero

495

495

Midi Music Generator

🎼

Generate MIDI music from prompts
Running

22

22

Japanese Lyric Generator

🎼

Generate Japanese lyrics
Running on L4

356

356

VALL E X

🎙

Generate audio from text with a custom voice
Running

2

2

AI晋さんメーカー

🔥

Generate Japanese voice from text
Build error

9

9

BangDream-ShojoKageki Bert VITS2

📉

Generate Japanese audio from text
Running

4

4

lovelive-ShojoKageki VITS JPZH

📈

Convert text to speech using multiple school voice models
Running

17

17

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP

🌖

Generate audio from text with ChatGPT integration
Running on T4

2.22k

2.22k

Bark

🐶

Generate realistic audio from text
Running

1.04k

1.04k

OpenVoice

🤗
Running

289

289

OpenVoiceV2

🤗

Generate customized spoken audio from text and voice reference
Runtime error

60

60

ChatTTS OpenVoice

🐠
Running on T4

185

185

MassivelyMultilingualTTS

🌍

Convert text to speech in multiple languages
Running on T4

2.43k

2.43k

XTTS

🐸
Running on A10G

4.82k

4.82k

MusicGen

🎵

Generate music from text and melody descriptions
Runtime error

517

517

Seamless M4T v2

📞
Runtime error

60

60

Mars5 Space

📉
Running on Zero

14

14

FAcodecV2

🎙

Reconstruct and convert voice audio
Running on A10G

252

252

TTS x Hallo Talking Portrait

👋

Generate Talking avatars from Text-to-Speech
Running on CPU Upgrade

400

400

RVC Genshin Impact

🎤

Convert audio voices using models
Running on Zero

109

109

FoleyCrafter

📚

Generate sound effects for silent videos
Running

247

247

Voice Clone Multilingual

🏃

Languages ru,en,zh-cn,ja,de,fr,it,pt,pl,tr,ko,nl,cs,ar,es,hu
Building

14

14

Talkalkai Cover

🐨

Execute dynamic code
Running on Zero

489

489

Image to Music v2

🎺

Get a music sample inspired by the mood of an image
Running

199

199

Whisper Timestamped

🕒

In-browser speech recognition w/ word-level timestamps
Running on CPU Upgrade

659

659

TTS Arena

🏆

Vote on the latest TTS models!
Running

21

21

TTSDS Benchmark and Leaderboard

🥇

Text-To-Speech (TTS) Evaluation using objective metrics.
Running

6

6

LAKH MIDI Dataset Search

🐨

Search and explore LAKH MIDI dataset with MidiCaps
Running on Zero

25

25

PicoAudio

📈

Generate audio from text descriptions
Running

16

16

Advanced MIDI Search

🏆

Search and explore 179k+ MIDI titles
Running on Zero

83

83

SenseVoice

🐠

Transcribe audio with emotions and events
Running

249

249

Whisper Speaker Diarization

🗣
Running

249

249

Faster Whisper Webui

🚀

Transcribe audio to text with speaker diarization
Running on Zero

43

43

Vocal Separation SOTA

🎤

Separate vocals from background in audio
Runtime error

99

99

BangDream-ShojoKageki Bert VITS2

🐠

Print "hello"
Running

2

2

BangDream-ShojoKageki Api

🐠

Convert text to speech using band character voices
Running

17

17

BangDream-ShojoKageki Bert VITS2

🐠

Generate audio from text with speaker selection and language translation
Sleeping

13

13

Efficient Audio Captioning

🔊
Running on Zero

177

177

NaturalSpeech3 FACodec

🏃

Convert and reconstruct speech files
Running

303

303

tts Text To Speech

🌍

Convert text to speech in multiple languages
Sleeping

4

4

Edge Tts

🌍
Runtime error

14

14

JA TTS Arena

🏆

Vote on the top Japanese TTS models!
Running

12

12

MIKU TTS

⚡

Convert text to voice using a musical model
Running

13

13

Genshin music generation

🎮

Genshin Impact Game Style Music Generator
Sleeping

3

3

Advanced RVC Inference

⚡
Sleeping

Style Bert VITS2 MT

🐠
Paused

3

3

ZeroRVC

🎙
Runtime error

13

13

Edge TTS w/ More Options

👁

Generate speech from text using various voices
Runtime error

33

33

EZ Voice Clone

⚡
Running

3

3

Training Helper Rvc

⚡

easy training helper For RVC
Running on Zero

21

21

Anitalker

🚀

Generate talking face video from image and audio
Running

7

7

rvc-Blue-archives

:

Convert and manipulate audio voices
Runtime error

75

75

Fish Diffusion (HiFiSinger) Demo

🌊
Running

17

17

Japanese Ero Voice Classifier

🥰

Classify audio into NSFW categories
Running

30

30

Style Bert VITS2 Editor Demo

😊

Generate voice with Style-Bert-VITS2
Running on L4

462

462

Fish Speech 1

🏆

Generate speech from text
Running

1

1

Rvc Demo

⚡

A demo of RVC pip
Runtime error

106

106

Bark Voice Cloning

🐶

Clone voices from audio files
Running

1

1

NeonAI Coqui AI TTS Plugin

🐸
Running

105

105

NeonAI Coqui AI TTS Plugin

🐸

Generate speech from text in multiple languages
Running

171

171

Qwen2 Audio Instruct Demo

🌍

Interact with a multimodal chatbot using text and audio
Runtime error

12

12

AICoverGen

🔥
Running

11

11

Harmonic Melody MIDI Mixer

🔥

Harmonize and mix any MIDI melody
Running

30

30

Ilaria Audio Analyzer

🎵

Create a spectrogram and get audio info
Running on Zero

753

753

Ilaria RVC

😻

Generate and modify audio with models
Running

4

4

MDX UVR

🚀

Separe vocal and instrumental tracks from audio
Running on Zero

130

130

GPT SoVITS V2

🤗

Generate speech from text with reference audio
Running

7

7

Read My Pdf Outloud

🗣

Generate audio from text or PDF
Running

6

6

Vocal Remover

⚡

Remove vocals from your music tracks easily
Running on Zero

812

812

Parler-TTS

🥖

High-fidelity Text-To-Speech
Runtime error

3

3

Japanese Ero Voice Classifier

🥰
Running

4

4

GPT-SoVITS-ToneControl_test

🐠

Generate Japanese audio from text
Running

23

23

Umamusume Bert Vits2

📊

Generate audio from text for anime characters
Running

1

1

Animalese Py

📈

Generate Animalese audio from text
Running

3

3

Animalese RVC

🔶

Convert text to Animalese using sound models
Build error

4

4

AI Hanser

📊
Running on Zero

159

159

Stable Audio Live Multiplayer

💻

Generate audio from text prompts
Running

669

669

Edge TTS Text To Speech

👁

Generate audio from text with voice customization
Running

19

19

Youtube AI Summarizer

🐨

Transcribe and summarize YouTube videos or audio files
Running

5

5

AICoverGen

🚀

Launch a web interface for downloading and managing YouTube videos
Running

1

1

Animalese Js

💻

Convert text to animal-like speech
Paused

1

1

ASR Model Comparison

💬
Running

4

4

AICoverGenMod

🔥

Start web UI for image generation
Running

1

1

Ilaria Converter

🔨

Convert audio and images to different formats
Running

1

1

RVC UI TES

👁

Convert and train voice models
Build error

8

8

RVC Genshin Impact

🎤
Sleeping

1

1

Voice2VoiceChatbot

🦀
Sleeping

RealTimeVoicetoVoiceChatbot

🌖
sp-uhh/speech-enhancement-sgmse

Audio-to-Audio • Updated Feb 2 • 38 • 9
Running

2

2

RVC UI

🏃

An easy-to-use voice conversion framework based on VITS.
Runtime error

RVC

🏃
Running

AI Voice Assistance

🌍
Running on Zero

2

2

Voice Clone

🗣

Clone voices by typing text and providing a reference audio file
Running

6

6

Optimus

🌍

Generate speech and translate audio using AI models
Running

41

41

Doc To Dialogue

👀

Transform a report or document into an interview/discussion
Running

51

51

Voicee

⚡

Super fastest Voice Assistant
Running

6

6

Fish Audio API Demo

🐟

Convert text to speech
Running on Zero

68

68

Musicgen Songstarter Demo

👁

Generate music using descriptions and optional melody audio
Running

83

83

Hololive Rvc Models V2

▶

Generate audio with voice conversion
Running

30

30

Advanced MIDI Renderer

🎹

Transform and render any MIDI
Sleeping

3

3

Imagen POP Music Medley Diffusion Transformer

🚀

Generate POP music medley with Imagen diffusion transformer
Sleeping

2

2

Ultimate MIDI Classifier

🔥

Classify absolutely any MIDI by genre, song and artist
Running on Zero

5

5

Intelligent MIDI Comparator

📚

Intelligently compare any pair of MIDIs
Running

97

97

ChatTTS Speaker

🌍

Browse and download ChatTTS speaker embeddings
Sleeping

2

2

Bridge Music Transformer

🌖

Generate a seamless bridge between two composition parts
Running

59

59

vits-simple-api

👀

Generate speech from text
Running

13

13

Bert VITS Umamusume Genshin HonkaiSR

🎙

Generate speech from text with customizable parameters
Running on Zero

45

45

Audio SR

🔊

Fixed fork of the original audio sr!
Running on Zero

238

238

Seed Voice Conversion

🎤

Convert voice to match another using reference audio
Running

41

41

Mini Omni

⚡

Generate audio responses from uploaded or recorded audio
Running

5

5

Monophonic MIDI Melody Harmonizer

⚡

Retrieval augmented harmonization of any MIDI melody
Running

11

11

MIDI Melody

⚡

Add a unique melody to any MIDI file
Running

3

3

MIDI Chords Mixer

🔥

Mix chords from one MIDI to another MIDI
Running

2

2

Morse To Audio

🏆

Convert Morse code to audio
Runtime error

1

1

RCV EASY GUI

🚀
Running

1

1

Advanced RVC Inference

⚡

Convert and modify voices in audio files
Running

3

3

Lyricsgenius

⚡

Get Lyrics from Genius's Link
Sleeping

1

1

Groq Gradio Voice Assistant

👁
Sleeping

2

2

Hex Separator

🐠
Running

3

3

Groq API Models

🐠

Groq API Playground
Paused

2

2

AI Tube Engine MusicGen

🎵
Paused

1

1

AI Tube Engine MusicGen

🎵
Paused

1

1

AI Tube Engine MusicGen

🎵
Paused

5

5

AI Tube Engine MusicGen

🎵
Running on Zero

9

9

UTMOSv2

🌖

Generate speech quality score from audio
Sleeping

5

5

Mini Omni

⚡
Configuration error

12

12

Bench.audio

📊

LMSYS bench for audio agents
Runtime error

78

78

Compressed Wav2Lip

🌟
Running

89

89

Gradio Lipsync Wav2lip

👄

Generate lip-synced video from video/image and audio
Runtime error

8

8

EchoMimic

🐨

Create lifelike animated videos using a photo and audio
Running

30

30

Wav2lip Gpu

🌍

Create a video by syncing spoken audio to an image
Running

1

1

Matcha TTS Japanese

🏃

Description of Matcha TTS Japanese
Running

98

98

DeepFilterNet2

💩

Generate clean audio from noisy recordings
Running on Zero

13

13

French Parler-TTS

🇫

High-fidelity Text-To-Speech
Running on Zero

262

262

EzAudio

🟣

Generate and edit audio from text prompts
Running on Zero

19

19

Kotoba Whisper Demo

🔥

Transcribe audio to text with timestamps
Running

1

1

Matcha Tts Onnx Benchmarks

🦀

Benchmark load model and tts time
Runtime error

7

7

Mini Omni

⚡
Sleeping

2

2

AIChat-matcha-tts-onnx-en

🐠

Give your space a voice! (Demo)
Running on Zero

14

14

GAMA

🌍

Answer questions about audio
Running on Zero

4

4

GAMA-IT

🏆

Analyze audio and answer questions about it
Runtime error

1

1

Sbv2 Py

🦀
Running on Zero

217

217

OpenMusic

🎶

Generate high-quality music from text descriptions
Building

3

3

Mistral 7B Instruct v0.3 Matcha-TTS English

🐠

Enjoy TTS Chat
Paused

2

2

Moshi

💨

Create interactive spoken dialogue using audio input
Running on Zero

49

49

EzAudio ControlNet

🟣

Generate audio with text and reference audio
Runtime error

3

3

Fish Audio API Demo

🐟
Runtime error

1

1

Whisper En Tiny

🐠
Sleeping

7

7

Guided Rock Music Transformer

🏃

Controlled source augmented rock music transformer
Running on Zero

22

22

Long-form MusicGen

🎷

Long-form Musicgen
Running

88

88

Multilingual TTS

💻

Convert text to speech in multiple languages
Running

4

4

AI岸田文雄メーカー

🔥

Generate realistic-sounding AI voice from text
Running

1

1

AI菅義偉メーカー

🔥

Generate菅義偉-like speech from text
Running

1

1

Audio Mouth

😻

Generate lip-synced talking head video from audio
Running

403

403

Pdf2audio

📚

Generate detailed script for podcast or lecture from text input
Running on CPU Upgrade

666

666

Open ASR Leaderboard

🏆

Request evaluation of a speech recognition model
Running on T4

1.05k

1.05k

Open NotebookLM

🎙

Personalised Podcasts For All - Available in 13 Languages
Running on Zero

4

4

Kotoba Whisper Bilingual Demo

🔥

Transcribe and translate Japanese & English audio
Running on T4

437

437

MeloTTS

🗣

Fast, efficient, & multilingual text-to-speech
Sleeping

197

197

Canary 1b

🐤

Transcribe and translate audio into text
Sleeping

1

1

Style Bert VITS2 SW

😻

Generate audio from text
Runtime error

21

21

Llama 3.2 3b Voice

👁
Runtime error

1

1

Pdf2audio

📚
Running on Zero

821

821

Whisper Turbo

🤯

Transcribe or translate audio and YouTube videos
Running on Zero

303

303

Realtime Whisper Turbo

🤯

Realtime implementation of Whisper large turbo
Running

156

156

Whisper Large V3 Turbo WebGPU

🚀

ML-powered speech recognition directly in your browser
Running on T4

281

281

Tortoise Tts

🐢

ExpressivText-to-Speech
Running

37

37

Russian Text To Speech

💻

Generate speech from text with accentuation
Running

6

6

Yt-dlp Wav

📉

Download video or audio from URL
Running on T4

300

300

UnlimitedMusicGen

🎼

unlimited Audio generation with a few added features
Runtime error

84

84

AudioCraft Plus v2.0.0a (MusicGen + AudioGen)

🎶
Runtime error

22

22

MusicGen+ V1.2.7 (HuggingFace Version)

🎼
Running on Zero

61

61

VoiceRestore

🏢

Restore degraded audio using a Transformer-based model
Sleeping

3

3

Whisperturbo

⚡

whisper3 turbo
Running

37

37

GPT-SoVITS-3s-cloning-free-TTS

🎙

Generate audio from text using selected character voices
Running

4

4

おしゃべり石破茂メーカー（Style-Bert-VITS2）

🏺

Generate audio from text using a customizable voice model
Running

1

1

おしゃべり二階俊博メーカー

🏺
Runtime error

3

3

Text To Meow

🐠
Running

4

4

Rvc Ui

🔥

Transform audio with pre-trained models and customize settings
Running

27

27

Reverb ASR Demo

🌍

Transcribe audio to text with style options
Running

2

2

Ilaria RVC Mod

😻

Separate vocals and instruments from audio
Running on T4

324

324

Resemble Enhance

🚀

Enhance and clean audio files
Running

3

3

Openai Whisper Large V3 Turbo

💻

Transcribe audio to text
Running

49

49

RVC PlayGround

💻

Convert audio voices to match a chosen model
Running

63

63

Podcastfy.ai - An Open Source alternative to NotebookLM's podcast feature

🚀

Generate a podcast from text, URLs, PDFs, and images
Running on Zero

75

75

Video to Music

🎞

Generate and apply matching music background to video shot
Running

192

192

Video SoundFX

👂

Generates a sound effect that matches video shot
Paused

170

170

Image2SFX Comparison

👂

Generates audio environment from an image
Running on Zero

197

197

Applio

🍏

Clone voices for custom TTS
Running on Zero

2.01k

2.01k

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Sleeping

1

1

Heartbeat

💜
Running on Zero

312

312

TTS Spaces Arena

🤗

Blind vote on HF TTS models!
Running on CPU Upgrade

69

69

xVASynth TTS

🧝

CPU powered, low RTF, emotional, multilingual TTS
Running

311

311

— AI Jukebox —

🎶

Generate music powered by AI
Running on L40S

335

335

TANGO

🐠

Co-Speech Gesture Video Generation
Running on Zero

16

16

Anime Whisper Demo

🥰

Transcribe Japanese audio to text
Running on Zero

65

65

Ichigo Llama3.1 S Instruct

🏢

Generate text from audio recordings
Running

9

9

Whisper Japanese Phone Demo

🚀

Whisper model to transcript japanese audio to katakana.
Running on Zero

195

195

ClearerVoice-Studio (Speech Enhancement, Separation and Extraction)

📈

Better AI powered platform to purify your speech signal
Running

19

19

Steganography

♫

Text | Image | Audio | Video to Spectrogram || Steganography
Running

17

17

AICoverGenMod

🔥

Generate Cover From AI Voice Model
Running

13

13

UVR5 UI

🚀

Separate instrumental and vocal tracks from audio files
Running on Zero

17

17

Diva Realtime Chat

🗣

Convert spoken words to text and voice assistant responses
Running on Zero

3

3

Kotoba Whisper Diarization Demo

👁

Transcribe and diarize your audio recordings
Running on Zero

14

14

Synthio Stable Audio Open

📚

Stable audio open model from Synthio paper.
Sleeping

1

1

RYO EVC

🚀
Runtime error

1

1

UVR

😻
Running on Zero

35

35

Moonshine ASR

🌒

Fast & efficient ASR outperforming Whisper!
Running

28

28

seewav-gui

🔊

Generate a visual waveform video from audio
Running on Zero

74

74

RWKV Music

🎵

Generate MIDI music using RWKV v4!
Running

5

5

MP3 Transcribe

💻

Whisper Transcribe MP3 files, use a GPU to convert faster!
Runtime error

7

7

StyleTTS 2 Zero

🗣

Efficient, fast, and natural text to speech with StyleTTS 2!
Running on Zero

252

252

MaskGCT TTS Demo

😻

MaskGCT TTS Demo
Running on Zero

80

80

MelodyFlow

🎵

Generate music from text and melody
Running on Zero

616

616

Whisper Large V3

🤫

Transcribe audio or YouTube videos
Running

5

5

Ultimate Chords Progressions Transformer

🚀

Self-correcting multi-instrumental chords transformer
Runtime error

8

8

Chords Progressions Transformer

🎶

Chords-conditioned music transformer
Running on Zero

30

30

Fast Whisper Turbo

⚡

Ultra-fast Whisper Turbo inference ⚡
Runtime error

305

305

AudioLDM2 Text2Audio Text2Music Generation

🔊

Generate a video waveform from text-based audio descriptions
Running

4

4

Hey Buddy!

🗣

In-Browser Audio Wake-Word Spotting
Running

3

3

Streamlit Pianoroll

🎹

Streamlit pianoroll playback element
Running

12

12

Audio-Separator (UVR)

⚡

Audio-Separator by Politrees
Running on Zero

98

98

Giant Music Transformer

🦖

Fast multi-instrumental music transformer
Sleeping

23

23

Omni Mini (WebRTC)

🌖
Sleeping

5

5

Fortepyan Datasets

🎹

Streamlit browser for piano music datasets.
Running

4

4

PIANO Dataset

🎹

Demo of masking tasks from the PIANO dataset
Running on L40S

138

138

Fish Agent

💬

An end-to-end (e2e) Voice Language Model by Fish Audio.
Running

8

8

Audio to Stems to MIDI Converter

🎵

Separate audio stems and convert to MIDI
Running

29

29

Podcast Generation

🌍

Generate podcasts with AI avatars
Sleeping

ChatTTS OpenVoice

🐠
Sleeping

1

1

OpenVoice

📚

Create personalized voice clips with情感
Running

11

11

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running

321

321

Bark with Voice Cloning

📊
Running on Zero

10

10

Midi Music Generator

🎼

Generate MIDI music sequences
Running

4

4

Audio Lyrics Extractor

🎵
Running

10

10

Did StyleTTS 2 Generate It?

🤔

Did StyleTTS 2 generate that audio?!?
Paused

35

35

Hertz Dev

🌍

base model for mono-channel completion
Running on Zero

15

15

Xtts

⚡

Create and clone voice clones for text-to-speech conversion
Running on Zero

255

255

ChatTTS Forge

💬

Lunch web-based text-to-speech interface
Running on Zero

2.24k

2.24k

Kokoro TTS

❤

Upgraded to v1.0!
Running

6

6

Pipertts

🌖

Generate voice audio from text input
Running

60

60

Nexa Omni Demo

🎧

Generate text from audio input
Running on Zero

14

14

MaskGCT TTS Demo

😻

MaskGCT TTS Demo
Sleeping

21

21

Video2music

📚

Generate music for a video based on its content and key
Running on L4

801

801

Audioldm Text To Audio Generation

🔊

Generate audio from text
Running

2

2

So VITS SVC

🦀

Generate Voice Clones
Running

2

2

GPT SoVITS

👀
Running on Zero

400

400

Spanish F5

🗣

Spanish finetune for the original F5 model.
Sleeping

2

2

Dolce SVC

🎤
Running

2

2

Dolce TTS

🎤

Generate speech from text
Running

2

2

Lipsync

⚡

Convert audio to lip-sync data
Running

5

5

Chino TTS

☕
Running

2

2

Style Bert VITS2 NO

🐨

Generate speech from text in multiple languages
Running

1

1

Style Bert VITS2 SU

📉

シャルティアのAI音声合成モデルを作りました。
Sleeping

1

1

Style Bert VITS2 MHY

🔥

早乙女乱馬（女）のAI音声合成モデルを作りました。
Sleeping

1

1

Style Bert VITS2 SAR

🚀

ベアトリスのAI音声合成モデルを作りました。
Paused

38

38

Talk To Ultravox

⚡

Talk to Fixie.ai's Ultravox with WebRTC ⚡️
Running

2

2

SoundOfWater

🏃

Estimate physical properties merely from pouring sound!
Running

9

9

Llama Code Editor

🐢

Create interactive HTML web pages with your voice
Running on CPU Upgrade

37

37

sutra-avatar-v2

🐨

Generate videos by adding speech to images or videos
Running

1

1

Audio Transcriber

🌍

Record an audio, then use AI to transcribe and translate it.
Running on Zero

17

17

Inpaint Music Transformer

🖌

Large and fast music transformer for pitches inpainting
Running

55

55

OuteTTS 0.2 500M Demo

🐠

Generate speech from text using selected language and speaker
Running

28

28

Tsukasa 司 Speech

🌖

Generate natural-sounding speech from text using a voice you choose
Running

8

8

MusicGen Continuation

🎵

Generate music based on text and melody
Sleeping

5

5

Semanticodec Ultra Low Bitrate Audio Codec

🚀

Ultra-low bitrate neural audio codec (0.31~1.40 kbps) with a
Running

21

21

Audiosr Versatile Audio Super Resolution

📚

Versatile audio super resolution (any -> 48kHz) with AudioSR
Paused

2

2

OuteTTS 0.2 500M Demo GPU

🐠

Generate human-like speech from text
Running

2

2

ChatTTS Forge English interface

💬

TTS tool
Running

1

1

Style Bert VITS2 RU2

📚

short_description: 猫屋敷まゆのAI音声合成モデルを作りました。
Running

14

14

Galgame Voice Finder

🥰

Search for similar game voice samples
Sleeping

1

1

Vad Go

👁
Running on Zero

168

168

Indic Parler-TTS

👀

A demo of Indic Parler-TTS
Sleeping

1

1

Voice Activity Detection

🐳
Running

6

6

Vikhr 4o

👀

Transform text to speech and speech to text
Running

19

19

Wespeaker Demo

🏢

Verify speakers using voice samples
Running

4

4

Wesep Tse 2speaker Demo

💻

Target Speaker Extraction with WeSep
Running

13

13

Wenet Demo

🐢

Transcribe speech into text
Running

5

5

Open_ASR_Leaderboard

🏆
Running

39

39

Text-to-Speech WebGPU

🗣

WebGPU text-to-Speech powered by OuteTTS and Transformers.js
Running

15

15

SpeechScore (Speech Quality Metrics and Evaluation)

📈

A home for scoring speech quality
Running

2

2

Fish Speech Benchmark

🐠

Non official benchmark by Fish Speech
Running on Zero

8

8

Chupa Generator

👅

Generate chupa sounds from text or audio
Running on Zero

7

7

Japanese Parler-TTS Mini Demo

🌖

Generate Japanese speech from text
Running on Zero

5

5

Japanese Parler-TTS Large Demo

🏢
Runtime error

3

3

Make Anime Emotion Dataset

⚡
Running

6

6

Anime Speech Emotion Recognition

😊

Detect emotions from an audio file
Running on Zero

594

594

MMAudio — generating synchronized audio from video/text

🔊

Create audio from videos or text prompts
Runtime error

28

28

Voice Clone

🗣

Clone a voice with text input
Running on Zero

193

193

Sound AI SFX

🐠

SText to Audio(Sound SFX) Generator
Runtime error

5

5

Talk To Moshi

👁

Talk to Kyutai's moshi - powered by Gradio WebRTC!
Running on T4

384

384

HierSpeech++ (Zero-shot TTS)

⚡

Generate high-quality speech from text using a prompt audio
Running

11

11

Talk To Gradio Docs Rag

🌍

Talk to the Gradio docs! Powered by Pydantic and WebRTC ⚡️
Running

6

6

Melody Workshop

📊

"One-minute creation by AI Coding Autonomous Agent MOUSE-I"
Running on Zero

13

13

Text2midi

📉

Generate music from text prompts
Running on Zero

122

122

Audio Llama

🔊

generated sound from video/text and search
Sleeping

2

2

VM Sound Classification

🐢

Identify audio type from speech or sounds
Sleeping

2

2

Lotus

🪷
Running

123

123

Moonshine Web

🌙

Real-time in-browser speech recognition
Running

9

9

Openai Realtime Voice

💻

Talk with openAI's new Realtime Voice API
Running on Zero

9

9

Fast GeCo

🏆

Separate noisy audio into clean speaker tracks
Running on Zero

9

9

SoloAudio

📉

Extract sounds from audio using text prompts
Running on Zero

6

6

SSR Speech

🐨

Generate edited English speech from audio and text
Running

24

24

Music Genre Classifier

🎶

Music Genre Classifier
Running

9

9

Guzheng Playing Tech

🪕

Guzheng Performance Technique Recognizer
Running

9

9

Chinese Instruments

🪕

Chinese Traditional Instrument Sound Retriever
Running

9

9

Pentatonic Mode

🪕

Chinese Music Pentatonic Mode Detector
Running

3

3

Audio Edit

🐨

Manipulate audio properties like speed, volume, and format
Paused

4

4

MMAudio

🔊

Video to Audio
Running

20

20

Audio Transcription

🎙

Transcribe audio to text from URLs or uploads
Sleeping

4

4

Audio 8D

📉

Make your audio to 8D
Running

16

16

Audio Separator

⚡

Audio-Separator Demo
Running

2

2

Real-time Whisper WebGPU (Vue)

🎤

Yet another Real-time Whisper with WebGPU, written in Vue
Running

6

6

MIDI Identification

🦀

Identify any MIDI
Running

3

3

Moonshine Web (Vue)

🌙

Yet another Real-time in-browser STT, re-implemented in Vue
Running

11

11

アイリ VTuber

🧸

アイリ VTuber. LLM powered Live2D/VRM living character.
Running

9

9

Figured Bass Calculator

🎵

figured bass calculator
Running

170

170

Ebook2audiobook V2.0 Beta

🚀

Added improvements, 1107+ languages supported
Running

3

3

Ebook2audiobook_v1.0

🐸

V1.0Convert any Ebook to AudioBook with Xtts + VoiceCloning!
Running

11

11

Ebook2audiobookPiper-tts

🪈

Converts Ebooks into audiobooks with piper-tts
Running

8

8

Ebook2AudiobookV25.3.2_Docker_Test

⚡

Ebook2audiobook docker space beta
Running

11

11

Music Vision

🎵

Audio Visualization Circle Effect Tool
Running

5

5

MS1-X Virtual Synth

📟

Ready-to-play synth instrument!
Running

8

8

hoyoTTS

🎮

Genshin Impact & Honkai Star Rail Game Character Voice TTS
Running

9

9

Erhu Playing Tech

🪕

Erhu Performance Technique Recognizer
Running

9

9

Bel Canto Discriminator

🎙

Discriminator of Bel Canto and Chinese Folk Singing
Running

12

12

Pianos

🎹

Piano Sound Quality Classifier
Running

13

13

Chest Falsetto Discriminator

🎤

Discriminator of Chest Vocie and Falsetto
Runtime error

193

193

CosyVoice2-0.5B

🥳

Generate realistic voice audio from text and audio prompts
Running on Zero

5

5

Monster Piano Transformer

👾

Ultra-fast and very well fitted solo Piano music transformer
Running

2

2

Style Bert VITS2 IM2

🌖

ヘスティアのAI音声合成モデルを作りました。
Sleeping

1

1

Style Bert VITS2 YHK2

🏃

フレイヤのAI音声合成モデルを作りました。
Paused

2

2

Anachrovox V0.1 Emerald (Bugged)

📻

Hands-Free AI Voice Chat with a Retro Vibe
Paused

3

3

Anachrovox V0.1 Azure (Bugged)

📻

Hands-Free AI Voice Chat with a Retro Vibe
Paused

2

2

Anachrovox V0.1 Amber (Bugged)

📻

Hands-Free AI Voice Chat with a Retro Vibe
Running

88

88

MIDI-Melody-Generator - One-minute creation by AI Coding Autonomous Agent

📉

https://huggingface.co/spaces/VIDraft/mouse-webgen
Running on Zero

22

22

Audio Separator

📊

Separate music and vocals from audio
Running

24

24

Open Universal Arabic Asr Leaderboard

🥇

A benchmark for open-source multi-dialect Arabic ASR models
Running on Zero

263

263

MusicGen Streaming

🔥

Generate music from text prompts
Running

2.59k

2.59k

Whisper JAX

⚡
Running on Zero

28

28

Parler-TTS Streaming

📝

High-fidelity Text-To-Speech
Running on L4

368

368

LatentSync

👄

Audio Conditioned LipSync with Latent Diffusion Models
Running on A10G

251

251

Singing Voice Conversion

🎼

Transform your voice into a singer's
Running

54

54

Text To Speech

🔥

Generate speech from text with different speakers
Running on Zero

5

5

DeepfakeDetection

🔥

Deepfake Detection
Running

2

2

Felguk Audio Edit

🦀

Audio edit
Running on Zero

250

250

Kokoro TTS Zero

🎴

✨[With v1.0.0] Accelerated TTS on Kokoro-82M
Running

4

4

📚 𝕡𝕕𝕗 𝕥𝕠 𝕊𝕡𝕖𝕖𝕔𝕙 ℂ𝕠𝕟𝕧𝕖𝕣𝕥𝕖𝕣 🎧

📚

Accessibility PDF & pasted text to speech converter w/ gTTs
Running on L4

1.26k

1.26k

SadTalker

😭
Running

2

2

OLLAMA TTS CLIENT

😎

Communicate with an AI assistant and convert text to speech
Running

9

9

Piper TTS Spanish

🚀

Convertir texto a audio
Running

60

60

Audio Visualizer - One-minute creation by AI Coding Autonomous Agent

🦀

https://huggingface.co/spaces/VIDraft/mouse-webgen
Sleeping

1

1

JARVIS2

🦀

2
Running on Zero

290

290

TangoFlux

🚀

Text to Audio (Sound SFX) Generator
Running

275

275

Rvc Models

🎤

Generate audio from text or modify voice pitch
Running

8

8

Karaoke MIDI Search

🎼

Search and play Karaoke MIDI by title, lyrics, or summary
Running

20

20

Semantic Audio Search w/ Transformers.js

🎵

Search music using keywords
Running on Zero

26

26

Misaki G2P

⚡

G2P
Running on Zero

3

3

ClearerVoice-Studio (Speech Super Resolution)

📈

Better AI powered platform to purify your speech signal
Running

1

1

Style Bert VITS2 NHR

🏃

結束いのりのAI音声合成モデルを作りました。
Sleeping

1

1

Style-Bert-VITS2-AJU YM

🌖

ドラクエ３の女勇者のAI音声合成モデルを作りました。
Running

1

1

Style Bert VITS2 AKT

⚡

喜屋武飛夏のAI音声合成モデルを作りました。
Running

68

68

3DAudio-Spectrum-Analyzer - One-minute creation by AI Coding Autonomous Agent

📉

https://huggingface.co/spaces/VIDraft/mouse-webgen
Running on Zero

55

55

OuteTTS 0.3 1B Demo

🔊

Generate speech from text with customizable voices
Paused

43

43

Badassgi

🤯

Korean Speech Transcribe(Text) and English Translate(Korean)
Running on Zero

20

20

Audiocraft

🎷

Demo for Jasco Model Music Stems Generation
Running

179

179

Kokoro Text-to-Speech

🗣

High-quality speech synthesis powered by Kokoro TTS
Running

4

4

AudioTranscribe

⚡

Transcribe and summarise audio files using AI.
Running

9

9

Parser163

🎵

NetEase Cloud Music MP3 Direct URL Parser
Runtime error

3

3

GSV MiSide Japanese

🌖

GPT-SoVITS for MITA!
Sleeping

2

2

Guided Accompaniment Transformer

🎺

Guided melody accompaniment generation with transformers
Running

6

6

Faster Whisper Webui with translate

✨
Runtime error

278

278

Llasa 3b Tts

🔥

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Sleeping

64

64

Qwen-Audio

🎤

Interact with a chatbot using text and audio
Running on Zero

21

21

Egyptian Arabic TTS

🐨

A humble space for trying EGTTS V0.1
Running on A100

198

198

YuE

👩

Generate music from lyrics and genre tags
Running on Zero

35

35

YuE

👩

OpenSource Music Generator
Running on Zero

2

2

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS
Running

3

3

MIDI Loops Mixer

🎨

Mix random MIDI loops into one coherent music composition
Running

2

2

Text To Speech Online

👀

Convert text to speech online
Running

6

6

Speech To Text Online

🎤

Convert spoken words to text
Runtime error

30

30

Llasa 8b Tts

🔥

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Runtime error

13

13

soundfont-generator

🦦

Generate soundfonts with latent flow matching
Running

2

2

Beepbox

📈

beepbox
Running on Zero

3

3

Voice Clone Multilingual

🏃

Languages ru,en,zh-cn,ja,de,fr,it,pt,pl,tr,ko,nl,cs,ar,es,hu
Sleeping

23

23

Auffusion

😻

Audio Gen, Audio Style Transfer and Audio InPainting
Paused

2

2

Talk To Ultravox

⚡

Talk to Fixie.ai's Ultravox with WebRTC ⚡️
Running

3

3

Kokoro TTS Translate v2.0

📉

This is a text-to-speech and translator app.
Running on Zero

4

4

Llasagna v0.1 1b TTS

🍕

Generate audio from text using a voice sample
Running

287

287

Kokoro Text-to-Speech (WebGPU)

🗣

High-quality speech synthesis powered by Kokoro TTS
Running

2

2

F5-TTS

🗣

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Running on Zero

67

67

InspireMusic

🎶

Music Generation - text to music, music continuation.
Running on Zero

40

40

Hibiki Simple

👄

High-Fidelity Simultaneous Speech-To-Speech Translation
Running

5

5

Music2emo

📊

Towards Unified Music Emotion Recognition across Dimensional
Running on Zero

10

10

Llasa 1b Multilingual TTS

🌍

Generate speech from text with or without cloning a voice
Running on Zero

2

2

Llama Midi

🦀

Write musical scores with LLaMA
Running on Zero

226

226

UVR5 UI

⚡

Separate audio into stems using various models
Running

11

11

Music source separation

🌖

Separate vocals and accompaniment from audio
Running on Zero

342

342

Zonos

🌍

Generate high-quality audio from text using various controls
Running on T4

97

97

Make Custom Voices With KokoroTTS

⚡

Make Custom Voices With KokoroTTS
Paused

5

5

Zonos

🔊

Speech Synthesis with Zonos
Running

46

46

Kokoro Web

🗣

ML-powered speech synthesis directly in your browser
Configuration error

201

201

AI Podcast Generator

🎙

Generate Podcast using Kokoro-TTS!
Running

8

8

Audio Arena

⚡

audio-arena
Running

9

9

GPT SoVITS V2

😻

Generate realistic voice from text with GPT-SoVITS model
Running on Zero

9

9

Llasa 1B Multi Speakers Genshin Zh En Ja Ko

🚀

Llasa-1B-Multilingual finetuned using simon3000/genshin-voic
Running

60

60

SoundwaveDemo

📉

Process audio and generate text output based on instructions
Sleeping

3

3

MIDI Templates Inpainter

🖌

Inpaint pitches in MIDI templates to create unique songs
Running

9

9

Guzheng Tech99

🪕

Frame-level guzheng playing technique detector
Running

1

1

Ilytka

💻

Generate audio from text
Running on Zero

3

3

AI Promo Studio with Llama 3

🎧

Generate creative radio Ads with AI.
Sleeping

1

1

Drum Groove Generator

📈

Generate drum beats from MIDI files
Running

2

2

MIDI Mamba159M HK

😻

Generate music and download as MP3 or MIDI
Running

18

18

Gemini Audi Video Chat

🏃

Have a video chat with Gemini - it can see you ⚡️
Running

1

1

RAD-TTS++ Ukrainian (Vocos)

🎧

Use RAD-TTS++ model to synthesize text in Ukrainian
Running on L40S

35

35

Skyreels A1 Talking Head

😻

Audio to Talking Face
Running on L40S

3

3

Di♪♪Rhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Runtime error

9

9

DiffRhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Running on Zero

382

382

Di♪♪Rhythm

🎶

Blazingly Fast and Embarrassingly Simple Song Generation
Running

3

3

DarijaTTS Test

🐢

Generate audio from Darija text
Running

2

2

NX Denoise

🐢

Improve your audio quality by removing noise
Running on T4

140

140

Spark TTS

🌖

A text-to-speech model powered by SparkAudio and Mobvoi.
Running

5

5

SonicOrbit

👁

transforms your audio files into immersive 360° binaural
Running on Zero

16

16

Generate Sound Effects From Image

🎶

Turns your image into matching sound effects
Running

1

1

VoiceReplacer

🏢

VoiceReplacer
Running

2

2

Indic Asr

🏆

A speech recognition tool for Indic languages.

Upvote

Collection guide
Browse collections

Spaces for Audio / Voices

AICoverGen

SBV2 Chupa Demo

VisualNovel_sbv_demo

Moe TTS

Bert-VITS2 AI Abe&Suga&Kishida

AICoverGen

rvc-Blue-archives-hoyogames

VTuber RVC Models

RVC Inference HF

Audio🔹Separator

BlueArchiveTTS

Multi Voice TTS(English/Chinese/Japanese)

Stable Audio Open Zero

Applio

Voice Clone

RVC⚡ZERO

Multilingual Anime TTS

DiffSinger🎶 Diffusion for Singing Voice Synthesis

Ultimate Vocal Remover WebUI

Aesthetic RVC Inference HF

Advanced RVC Inference

Vits Models

Multilingual Anime TTS

LoveLive-ShojoKageki VITS

vits-uma-genshin-honkai

おしゃべり晋さんメーカー（Style-Bert-VITS2）

Hololive Style-Bert-VITS2

Midi Music Generator

Japanese Lyric Generator

VALL E X

AI晋さんメーカー

BangDream-ShojoKageki Bert VITS2

lovelive-ShojoKageki VITS JPZH

Lovelive-nijigasaki-MB-iSTFT-VITS-ZH&JP

Bark

OpenVoice

OpenVoiceV2

ChatTTS OpenVoice

MassivelyMultilingualTTS

XTTS

MusicGen

Seamless M4T v2

Mars5 Space

FAcodecV2

TTS x Hallo Talking Portrait

RVC Genshin Impact

FoleyCrafter

Voice Clone Multilingual

Talkalkai Cover

Image to Music v2

Whisper Timestamped

TTS Arena

TTSDS Benchmark and Leaderboard

LAKH MIDI Dataset Search

PicoAudio

Advanced MIDI Search

SenseVoice

Whisper Speaker Diarization

Faster Whisper Webui

Vocal Separation SOTA

BangDream-ShojoKageki Bert VITS2

BangDream-ShojoKageki Api

BangDream-ShojoKageki Bert VITS2

Efficient Audio Captioning

NaturalSpeech3 FACodec

tts Text To Speech

Edge Tts

JA TTS Arena

MIKU TTS

Genshin music generation

Advanced RVC Inference

Style Bert VITS2 MT

ZeroRVC

Edge TTS w/ More Options

EZ Voice Clone

Training Helper Rvc

Anitalker

rvc-Blue-archives

Fish Diffusion (HiFiSinger) Demo