Hev832 commited on
Commit
6f468f0
1 Parent(s): f6adf0b

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +0 -197
README.md CHANGED
@@ -14,200 +14,3 @@
14
 
15
  [![Discord](https://img.shields.io/badge/RVC%20Developers-Discord-7289DA?style=for-the-badge&logo=discord&logoColor=white)](https://discord.gg/HcsmBBGyVk)
16
 
17
- [**更新日志**](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/Changelog_CN.md) | [**常见问题解答**](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98%E8%A7%A3%E7%AD%94) | [**AutoDL·5毛钱训练AI歌手**](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/Autodl%E8%AE%AD%E7%BB%83RVC%C2%B7AI%E6%AD%8C%E6%89%8B%E6%95%99%E7%A8%8B) | [**对照实验记录**](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/Autodl%E8%AE%AD%E7%BB%83RVC%C2%B7AI%E6%AD%8C%E6%89%8B%E6%95%99%E7%A8%8B](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/%E5%AF%B9%E7%85%A7%E5%AE%9E%E9%AA%8C%C2%B7%E5%AE%9E%E9%AA%8C%E8%AE%B0%E5%BD%95)) | [**在线演示**](https://modelscope.cn/studios/FlowerCry/RVCv2demo)
18
-
19
- [**English**](./docs/en/README.en.md) | [**中文简体**](./README.md) | [**日本語**](./docs/jp/README.ja.md) | [**한국어**](./docs/kr/README.ko.md) ([**韓國語**](./docs/kr/README.ko.han.md)) | [**Français**](./docs/fr/README.fr.md) | [**Türkçe**](./docs/tr/README.tr.md) | [**Português**](./docs/pt/README.pt.md)
20
-
21
- </div>
22
-
23
- > 底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用
24
-
25
- > 请期待RVCv3的底模,参数更大,数据更大,效果更好,基本持平的推理速度,需要训练数据量更少。
26
-
27
- <table>
28
- <tr>
29
- <td align="center">训练推理界面</td>
30
- <td align="center">实时变声界面</td>
31
- </tr>
32
- <tr>
33
- <td align="center"><img src="https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/assets/129054828/092e5c12-0d49-4168-a590-0b0ef6a4f630"></td>
34
- <td align="center"><img src="https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/assets/129054828/730b4114-8805-44a1-ab1a-04668f3c30a6"></td>
35
- </tr>
36
- <tr>
37
- <td align="center">go-web.bat</td>
38
- <td align="center">go-realtime-gui.bat</td>
39
- </tr>
40
- <tr>
41
- <td align="center">可以自由选择想要执行的操作。</td>
42
- <td align="center">我们已经实现端到端170ms延迟。如使用ASIO输入输出设备,已能实现端到端90ms延迟,但非常依赖硬件驱动支持。</td>
43
- </tr>
44
- </table>
45
-
46
- ## 简介
47
- 本仓库具有以下特点
48
- + 使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
49
- + 即便在相对较差的显卡上也能快速训练
50
- + 使用少量数据进行训练也能得到较好结果(推荐至少收集10分钟低底噪语音数据)
51
- + 可以通过模型融合来改变音色(借助ckpt处理选项卡中的ckpt-merge)
52
- + 简单易用的网页界面
53
- + 可调用UVR5模型来快速分离人声和伴奏
54
- + 使用最先进的[人声音高提取算法InterSpeech2023-RMVPE](#参考项目)根绝哑音问题。效果最好(显著地)但比crepe_full更快、资源占用更小
55
- + A卡I卡加速支持
56
-
57
- 点此查看我们的[演示视频](https://www.bilibili.com/video/BV1pm4y1z7Gm/) !
58
-
59
- ## 环境配置
60
- 以下指令需在 Python 版本大于3.8的环境中执行。
61
-
62
- ### Windows/Linux/MacOS等平台通用方法
63
- 下列方法任选其一。
64
- #### 1. 通过 pip 安装依赖
65
- 1. 安装Pytorch及其核心依赖,若已安装则跳过。参考自: https://pytorch.org/get-started/locally/
66
- ```bash
67
- pip install torch torchvision torchaudio
68
- ```
69
- 2. 如果是 win 系统 + Nvidia Ampere 架构(RTX30xx),根据 #21 的经验,需要指定 pytorch 对应的 cuda 版本
70
- ```bash
71
- pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
72
- ```
73
- 3. 根据自己的显卡安装对应依赖
74
- - N卡
75
- ```bash
76
- pip install -r requirements.txt
77
- ```
78
- - A卡/I卡
79
- ```bash
80
- pip install -r requirements-dml.txt
81
- ```
82
- - A卡ROCM(Linux)
83
- ```bash
84
- pip install -r requirements-amd.txt
85
- ```
86
- - I卡IPEX(Linux)
87
- ```bash
88
- pip install -r requirements-ipex.txt
89
- ```
90
-
91
- #### 2. 通过 poetry 来安装依赖
92
- 安装 Poetry 依赖管理工具,若已安装则跳过。参考自: https://python-poetry.org/docs/#installation
93
- ```bash
94
- curl -sSL https://install.python-poetry.org | python3 -
95
- ```
96
-
97
- 通过 Poetry 安装依赖时,python 建议使用 3.7-3.10 版本,其余版本在安装 llvmlite==0.39.0 时会出现冲突
98
- ```bash
99
- poetry init -n
100
- poetry env use "path to your python.exe"
101
- poetry run pip install -r requirments.txt
102
- ```
103
-
104
- ### MacOS
105
- 可以通过 `run.sh` 来安装依赖
106
- ```bash
107
- sh ./run.sh
108
- ```
109
-
110
- ## 其他预模型准备
111
- RVC需要其他一些预模型来推理和训练。
112
-
113
- 你可以从我们的[Hugging Face space](https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main/)下载到这些模型。
114
-
115
- ### 1. 下载 assets
116
- 以下是一份清单,包括了所有RVC所需的预模型和其他文件的名称。你可以在`tools`文件夹找到下载它们的脚本。
117
-
118
- - ./assets/hubert/hubert_base.pt
119
-
120
- - ./assets/pretrained
121
-
122
- - ./assets/uvr5_weights
123
-
124
- 想使用v2版本模型的话,需要额外下载
125
-
126
- - ./assets/pretrained_v2
127
-
128
- ### 2. 安装 ffmpeg
129
- 若ffmpeg和ffprobe已安装则跳过。
130
-
131
- #### Ubuntu/Debian 用户
132
- ```bash
133
- sudo apt install ffmpeg
134
- ```
135
- #### MacOS 用户
136
- ```bash
137
- brew install ffmpeg
138
- ```
139
- #### Windows 用户
140
- 下载后放置在根目录。
141
- - 下载[ffmpeg.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe)
142
-
143
- - 下载[ffprobe.exe](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe)
144
-
145
- ### 3. 下载 rmvpe 人声音高提取算法所需文件
146
-
147
- 如果你想使用最新的RMVPE人声音高提取算法,则你需要下载音高提取模型参数并放置于RVC根目录。
148
-
149
- - 下载[rmvpe.pt](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt)
150
-
151
- #### 下载 rmvpe 的 dml 环境(可选, A卡/I卡用户)
152
-
153
- - 下载[rmvpe.onnx](https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.onnx)
154
-
155
- ### 4. AMD显卡Rocm(可选, 仅Linux)
156
-
157
- 如果你想基于AMD的Rocm技术在Linux系统上运行RVC,请先在[这里](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)安装所需的驱动。
158
-
159
- 若你使用的是Arch Linux,可以使用pacman来安装所需驱动:
160
- ````
161
- pacman -S rocm-hip-sdk rocm-opencl-sdk
162
- ````
163
- 对于某些型号的显卡,你可能需要额外配置如下的环境变量(如:RX6700XT):
164
- ````
165
- export ROCM_PATH=/opt/rocm
166
- export HSA_OVERRIDE_GFX_VERSION=10.3.0
167
- ````
168
- 同时确保你的当前用户处于`render`与`video`用户组内:
169
- ````
170
- sudo usermod -aG render $USERNAME
171
- sudo usermod -aG video $USERNAME
172
- ````
173
-
174
- ## 开始使用
175
- ### 直接启动
176
- 使用以下指令来启动 WebUI
177
- ```bash
178
- python infer-web.py
179
- ```
180
-
181
- 若先前使用 Poetry 安装依赖,则可以通过以下方式启动WebUI
182
- ```bash
183
- poetry run python infer-web.py
184
- ```
185
-
186
- ### 使用整合包
187
- 下载并解压`RVC-beta.7z`
188
- #### Windows 用户
189
- 双击`go-web.bat`
190
- #### MacOS 用户
191
- ```bash
192
- sh ./run.sh
193
- ```
194
- ### 对于需要使用IPEX技术的I卡用户(仅Linux)
195
- ```bash
196
- source /opt/intel/oneapi/setvars.sh
197
- ```
198
-
199
- ## 参考项目
200
- + [ContentVec](https://github.com/auspicious3000/contentvec/)
201
- + [VITS](https://github.com/jaywalnut310/vits)
202
- + [HIFIGAN](https://github.com/jik876/hifi-gan)
203
- + [Gradio](https://github.com/gradio-app/gradio)
204
- + [FFmpeg](https://github.com/FFmpeg/FFmpeg)
205
- + [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
206
- + [audio-slicer](https://github.com/openvpi/audio-slicer)
207
- + [Vocal pitch extraction:RMVPE](https://github.com/Dream-High/RMVPE)
208
- + The pretrained model is trained and tested by [yxlllc](https://github.com/yxlllc/RMVPE) and [RVC-Boss](https://github.com/RVC-Boss).
209
-
210
- ## 感谢所有贡献者作出的努力
211
- <a href="https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/graphs/contributors" target="_blank">
212
- <img src="https://contrib.rocks/image?repo=RVC-Project/Retrieval-based-Voice-Conversion-WebUI" />
213
- </a>
 
14
 
15
  [![Discord](https://img.shields.io/badge/RVC%20Developers-Discord-7289DA?style=for-the-badge&logo=discord&logoColor=white)](https://discord.gg/HcsmBBGyVk)
16