ChatTTS-Forge / README.md
zhzluke96
update
d2b7e94

A newer version of the Gradio SDK is available: 5.6.0

Upgrade
metadata
title: ChatTTS Forge
emoji: 💬
colorFrom: yellow
colorTo: purple
sdk: gradio
app_file: webui.py
pinned: true
license: agpl-3.0
sdk_version: 4.36.1

HuggingFace Space Limit

由于 HuggingFace 对 GPU 运行时长有限制,超长任务会被强制停止(同时还会消耗 quota...),所以本 space 对文本长度做出如下限制:

类型 最大字符数
TTS 2000 字符
SSML 3000 字符(不计算 SSML 标签,只计算文本)

HuggingFace Space Limit

Due to the runtime limit for GPU usage on HuggingFace, extremely long tasks will be forcibly stopped (and they will also consume quota...), so this space imposes the following restrictions on text length:

Type Maximum Characters
TTS 2000 characters
SSML 3000 characters (excluding SSML tags, only counting text)

🗣️ ChatTTS-Forge

GitHub Repo stars

这个Space展示了强大的ChatTTS-Forge项目,基于 ChatTTS 开源模型,生成丰富的文本转语音内容。

欢迎随时体验我们的项目,或者复制以便无需排队运行你自己的实例!完整文档请访问我们的GitHub仓库

🔎 想了解更多关于SSML语法的信息,请查看我们的SSML指南

🔨 有关API部署的信息,请参考GitHub上的部署部分

🚀 如果您想使用 Colab 进行部署,点击一键部署:Open In Colab

en

This Space demonstrates the powerful ChatTTS-Forge project, based on the open-source ChatTTS model, which generates rich text-to-speech content.

Feel free to explore our project, or duplicate it to run your own instances without a queue! For the full documentation, please visit our GitHub repository.

🔎 To learn more about SSML syntax, check out our SSML guide.

🔨 For information on deploying the API, please refer to the deployment section on GitHub.

🚀 If you want to deploy using Colab, click for one-click deployment: Open In Colab

styles (Experimental)

由于自回归模型的特性,我们可以对生成过程进行干扰和控制,目前,仅为实验性质功能

styles table

文件 ./data/styles.csv 中包含所有风格,下面是具体的设定

风格名带有 _p 结尾的是注入上下文的风格,可能导致质量下降但是控制更强一点

风格 说明
advertisement_upbeat 用兴奋和精力充沛的语气推广产品或服务。
affectionate 以较高的音调和音量表达温暖而亲切的语气。说话者处于吸引听众注意力的状态。说话者的个性往往是讨喜的。
angry 表达生气和厌恶的语气。
assistant 数字助理用的是热情而轻松的语气。
calm 以沉着冷静的态度说话。语气、音调和韵律与其他语音类型相比要统一得多。
chat 表达轻松随意的语气。
cheerful 表达积极愉快的语气。
customerservice 以友好热情的语气为客户提供支持。
depressed 调低音调和音量来表达忧郁、沮丧的语气。
disgruntled 表达轻蔑和抱怨的语气。这种情绪的语音表现出不悦和蔑视。
documentary-narration 用一种轻松、感兴趣和信息丰富的风格讲述纪录片,适合配音纪录片、专家评论和类似内容。
embarrassed 在说话者感到不舒适时表达不确定、犹豫的语气。
empathetic 表达关心和理解。
envious 当你渴望别人拥有的东西时,表达一种钦佩的语气。
excited 表达乐观和充满希望的语气。似乎发生了一些美好的事情,说话人对此满意。
fearful 以较高的音调、较高的音量和较快的语速来表达恐惧、紧张的语气。说话人处于紧张和不安的状态。
friendly 表达一种愉快、怡人且温暖的语气。听起来很真诚且满怀关切。
gentle 以较低的音调和音量表达温和、礼貌和愉快的语气。
hopeful 表达一种温暖且渴望的语气。听起来像是会有好事发生在说话人身上。
lyrical 以优美又带感伤的方式表达情感。
narration-professional 以专业、客观的语气朗读内容。
narration-relaxed 为内容阅读表达一种舒缓而悦耳的语气。
newscast 以正式专业的语气叙述新闻。
newscast-casual 以通用、随意的语气发布一般新闻。
newscast-formal 以正式、自信和权威的语气发布新闻。
poetry-reading 在读诗时表达出带情感和节奏的语气。
sad 表达悲伤语气。
serious 表达严肃和命令的语气。说话者的声音通常比较僵硬,节奏也不那么轻松。
shouting 表达一种听起来好像声音在远处或在另一个地方的语气,努力让别人听清楚。
sports_commentary 表达一种既轻松又感兴趣的语气,用于播报体育赛事。
sports_commentary_excited 用快速且充满活力的语气播报体育赛事精彩瞬间。
whispering 表达一种柔和的语气,试图发出安静而柔和的声音。
terrified 表达一种害怕的语气,语速快且声音颤抖。听起来说话人处于不稳定的疯狂状态。
unfriendly 表达一种冷淡无情的语气。