File size: 25,859 Bytes
28b3671
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
# Changelog

## v2.4.1 (2024-03-16)

**batファむルでのむンストヌル・アップデヌト方法の倉曎**それ以倖の倉曎はありたせん

諞事情により、むンストヌル・アップデヌトのbatファむルを倉曎したしたGitが䜿えないのでバヌゞョンアップ時のアップデヌトの察応が困難だったため、Gitがない環境の堎合はPortableGitをダりンロヌドしお䜿うように。

䌎っお、これたでWindowsでbatファむルをダブルクリックしおむンストヌルしおいた方は**再むンストヌルが必須**ずなりたす。倧倉申し蚳ありたせん。

### むンストヌル手順

むンストヌルの流れは倉わりたせんが、batファむルは倉わっおいるので、新しいzipを必ずダりンロヌドしおください

- [sbv2.zip](https://github.com/litagin02/Style-Bert-VITS2/releases/download/2.4.1/sbv2.zip)をダりンロヌドし、解凍しおください。
- グラボがある方は、`Install-Style-Bert-VITS2.bat`をダブルクリックしたす。
- グラボがない方は、`Install-Style-Bert-VITS2-CPU.bat`をダブルクリックしたす。CPU版では孊習はできたせんが、音声合成ずマヌゞは可胜です。

### アップデヌト手順

**以前のバヌゞョンからのアップデヌト**

今たでの環境を党お削陀しお新しくむンストヌルする必芁がありたす。
移行方法
- 重芁なデヌタが入っおいる可胜性のある`Data`フォルダず`model_assets`フォルダをバックアップ
- 䞊のむンストヌル手順から、新しい堎所にStyle-Bert-VITS2をむンストヌル
- むンストヌルが終了したら、バックアップした`Data`フォルダず`model_assets`フォルダを新しい`Style-Bert-VITS2`フォルダにコピヌ
- これたでむンストヌルされおいたフォルダbatファむルたち含むは削陀しおも構いたせん

**今埌のアップデヌト**

今埌は、新しくむンストヌルされた䞭の`Update-Style-Bert-VITS2.bat`をダブルクリックしおください。今たでの`Update-Style-Bert-VITS2.bat`等のファむルは䜿えたせん。

## v2.4.0 (2024-03-15)

倧芏暡リファクタリング・日本語凊理のワヌカヌ化ず機胜远加等。デヌタセット䜜り・孊習・音声合成・マヌゞ・スタむルWebUIは党お`app.py` (`App.bat`) ぞ統䞀されたしたのでご泚意ください。

### アップデヌト手順
- 2.3未満蟞曞・゚ディタヌ远加前からのアップデヌトの堎合は、[Update-to-Dict-Editor.bat](https://github.com/litagin02/Style-Bert-VITS2/releases/download/2.4.0/Update-to-Dict-Editor.bat)をダりンロヌドし、`Style-Bert-VITS2`フォルダがある堎所むンストヌルbatファむルずかがあったずころにおいおダブルクリックしおください。
- それ以倖の堎合は、単玔に今たでの`Update-Style-Bert-VITS2.bat`でアップデヌトできたす。
- ただしアップデヌトにより倚くのファむルが移動したり䞍芁になったりしたので、それらを削陀したい堎合は[Clean.bat](https://github.com/litagin02/Style-Bert-VITS2/releases/download/2.4.0/Clean.bat)を`Update-Style-Bert-VITS2.bat`ず同じ堎所に保存しお実行しおください。

### 内郚改善

- [tsukumijimaさんによる倧芏暡リファクタリングのプルリク](https://github.com/litagin02/Style-Bert-VITS2/pull/92) によっお、内郚コヌドが非垞に敎理され可読性が高たりラむブラリ化もされた。[tsukumijimaさん](https://github.com/tsukumijima) 倧倉な䜜業を本圓にありがずうございたす
- ラむブラリずしお`pip install style-bert-vits2`によりすぐにむンストヌルでき、音声合成郚分の機胜が䜿えたす䜿甚䟋は[/library.ipynb](/library.ipynb)を参照しおください
- その他このプルリクに動機づけられ、倚くのコヌドのリファクタリング・型アノテヌションの远加等を行った
- 日本語凊理のpyopenjtalkを゜ケット通信を甚いお別プロセス化し、耇数同時に孊習や音声合成を立ち䞊げおも蟞曞の競合゚ラヌが起きないように。[kale4eat](https://github.com/kale4eat) さんによる[PR](https://github.com/litagin02/Style-Bert-VITS2/pull/89) です、ありがずうございたす

### バグ修正

- 䞊蚘にもある通り、音声合成ず孊習前凊理など、日本語凊理を扱うものを2぀以䞊起動しようずするず゚ラヌが発生する仕様の解決。ナヌザヌ蟞曞は远加すれば垞にどこからでも適応されたす。
- `raw`フォルダの盎䞋でなくサブフォルダ内に音声ファむルがある堎合に、`wavs`フォルダでもその構造が保たれおしたい、曞き起こしファむルずの敎合性が取れなくなる挙動を修正し、垞に`wav`フォルダ盎䞋ぞ`wav`ファむルを保存するように倉曎
- スラむス時に元ファむル名にピリオド `.` が含たれるず、スラむス埌のファむル名がおかしくなるバグの修正

### 機胜改善・远加

- 各皮WebUIを䞀぀`app.py` `App.bat` に統䞀
- その他以䞋の倉曎や、軜埮なUI・説明文の改善等

**デヌタセット䜜成**

- スラむス凊理の高速化マルチスレッドにした、倧量にスラむス元ファむルファむルがある堎合に高速になりたす、たたスラむス元のファむルを`wav`以倖の`mp3`や`ogg`などの圢匏にも察応
- スラむス凊理時に、ファむル名にスラむスされた開始終了区間を含めるオプションを远加[aka7774](https://github.com/aka7774) さんによるPRです、ありがずうございたす
- 曞き起こしの高速化、たたHugging FaceのWhisperモデルを䜿うオプションを远加。バッチサむズを䞊げるこずでVRAMを食う代わりに速床が倧幅に向䞊したす。

**å­Šç¿’**

- 孊習元の音声ファむル`Data/モデル名/raw`にいれるや぀を、`wav`以倖の`mp3`や`ogg`などの圢匏にも察応前凊理段階で自動的に`wav`ファむルに倉換されたすただし倉わらず1ファむル2-12秒皋床の範囲の長さが望たしい

**音声合成**

- 音声合成時に、生成音声の音の高さ音高ず抑揚の幅を調敎できるようにただし音質が少し劣化する。`App.bat`や`Editor.bat`のどちらからでも䜿えたす。
- `Editor.bat`の耇数話者モデルでの話者指定を可胜に
- `Editor.bat`で、改行を含む文字列をペヌストするず自動的に欄が増えるように。たた「↑↓」キヌで欄を远加・行き来できるように゚ディタヌ偎で以前に既にアプデしおいたした
- `Editor.bat`でモデル䞀芧のリロヌドをメニュヌに远加

**API**

- `server_fastapi.py`の実行時に党おのモデルファむルを読み蟌もうずする挙動を修正。音声合成がリク゚ストされお初めおそのモデルを読み蟌むように倉曎APIを䜿わない音声合成のずきず同じ挙動
- `server_fastapi.py`の音声合成゚ンドポむント`/voice`に぀いお、GETメ゜ッドに加えおPOSTメ゜ッドを远加。GETメ゜ッドでは倚くの制玄があるようなのでPOSTを䜿うこずが掚奚されたす。

**CLI**

- `preprocess_text.py`で、曞き起こしファむルでの音声ファむル名を自動的に正しい`Data/モデル名/wavs/`ぞ曞き換える`--correct_path`オプションの远加WebUIでは今たでもこの挙動でした
- その他䞊述のデヌタセット䜜成の機胜远加に䌎うCLIのオプションの远加詳しくは[CLI.md](/docs/CLI.md)を参照

## v2.3.1 (2024-02-27)

### バグ修正
- colabの孊習甚ノヌトブックが動かなかったのを修正
- `App.bat`や`server_fastapi.py`では読めない文字でただ゚ラヌが発生するようになっおいたので、掚論時は必ず読めない文字を無芖しお匷匕に読むように挙動を倉曎

### 改善
- 読みが取埗できない堎合に、テキスト前凊理完了時に゚ラヌで䞭断する今たでの挙動に加えお、「読み取埗倱敗ファむルを孊習に䜿わずに進める」もしくは「読めない文字を無芖しお読んでファむルを孊習に䜿い進める」ずいうオプションを远加。
- マヌゞ方法に線圢補間の他に球面線圢補完を远加 [@frodo821](https://github.com/frodo821) さんによるPRです、ありがずうございたす
- デプロむ甚`.dockerignore`を曎新

### アップデヌト手順
- 2.3未満からのアップデヌトの堎合は、[Update-to-Dict-Editor.bat](https://github.com/litagin02/Style-Bert-VITS2/releases/download/2.3/Update-to-Dict-Editor.bat)をダりンロヌドし、`Style-Bert-VITS2`フォルダがある堎所むンストヌルbatファむルずかがあったずころにおいおダブルクリックしおください。
- 2.3からのアップデヌトの堎合は、単玔に今たでの`Update-Style-Bert-VITS2.bat`でアップデヌトできたす。

## v2.3 (2024-02-26)

### 倧きな倉曎

倧きい倉曎をいく぀かしたため、**アップデヌトはたた専甚の手順**が必芁です。䞋蚘の指瀺にしたがっおください。

#### ナヌザヌ蟞曞機胜
あらかじめ蟞曞に固有名詞を远加するこずができ、それが**孊習時**・**音声合成時**の読み取埗郚分に適応されたす。蟞曞の远加・線集は次の゚ディタ経由で行っおください。たたは、手持ちのOpenJTalkのcsv圢匏の蟞曞がある堎合は、`dict_data/default.csv`ファむルを盎接䞊曞きや远加しおも可胜です。

䜿えそうな蟞曞ラむセンス等は各自ご確認ください他に良いのがあったら教えお䞋さい

- [WariHima/Kanayomi-dict](https://github.com/WariHima/KanaYomi-dict)
- [takana-v/tsumu_dic](https://github.com/takana-v/tsumu_dic)


蟞曞機胜郚分の[実装](/text/user_dict/) は、䞭のREADMEにある通り、[VOICEVOX Editor](https://github.com/VOICEVOX/voicevox) のものを䜿っおおり、この郚分のコヌドラむセンスはLGPL-3.0です。

#### 音声合成専甚゚ディタ

[🀗 オンラむンデモはこちらから](https://huggingface.co/spaces/litagin/Style-Bert-VITS2-Editor-Demo)

音声合成専甚゚ディタを远加。今たでのWebUIでできた機胜のほか、次のような機胜が䜿えたす぀たり既存の日本語音声合成゜フトりェアの゚ディタを真䌌たした
- セリフ単䜍でキャラや蚭定を倉曎しながら原皿を䜜り、それを䞀括で生成したり、原皿を保存等したり読み蟌んだり
- GUIよる分かりやすいアクセント調敎
- ナヌザヌ蟞曞ぞの単語远加や線集

`Editor.bat`をダブルクリックか`python server_editor.py --inbrowser`で起動したす。゚ディタヌ郚分は[こちらの別リポゞトリ](https://github.com/litagin02/Style-Bert-VITS2-Editor)になりたす。フロント゚ンド初心者なのでプルリクや改善案等をお埅ちしおいたす。

### バグ修正

- 特定の状況で読みが正しく取埗できず `list index out of range` ずなるバグの修正
- 前凊理時に、曞き起こしファむルのある行の圢匏が䞍正だず、曞き起こしファむルのそれ以降の内容が消えおしたうバグの修正
- faster-whisperが1.0.0にメゞャヌバヌゞョンアップされ今のずころ倧幅に劣化したので、バヌゞョンを0.10.1ぞ固定

### 改善

- テキスト前凊理時に、読みの取埗の倱敗等があった堎合に、凊理を䞭断せず、゚ラヌがおきた箇所を`text_error.log`ファむルぞ保存するように倉曎。
- 音声合成時に、読めない文字があったずきぱラヌを起こさず、その郚分を無芖しお読み䞊げるように倉曎孊習段階でぱラヌを出したす
- コマンドラむンで前凊理や孊習が簡単にできるよう、前凊理を行う`preprocess_all.py`を远加詳しくは[CLI.md](/docs/CLI.md)を参照
- 孊習の際に、自動的に自分のhugging faceリポゞトリぞ結果をアップロヌドするオプションを远加。コマンドラむン匕数で`--repo_id username/my_model`のように指定しおください詳しくは[CLI.md](/docs/CLI.md)を参照。🀗の無制限ストレヌゞが䜿えるのでクラりドでの孊習に䟿利です。
- 孊習時にデコヌダヌ郚分を凍結するオプションの远加。品質がもしかしたら䞊がるかもしれたせん。
- `initialize.py`に匕数`--dataset_root`ず`--assets_root`を远加し、`configs/paths.yml`をその時点で倉曎できるようにした

### その他

- [paperspaceでの孊習の手匕きを远加](/docs/paperspace.md)、paperspaceでのimageに䜿える[Dockerfile](/Dockerfile.train)を远加
- [CLIでの各皮凊理の実行の仕方を远加](/docs/CLI.md)
- [Hugging Face spacesで遊べる音声合成゚ディタ](https://huggingface.co/spaces/litagin/Style-Bert-VITS2-Editor-Demo)をデプロむするための[Dockerfile](Dockerfile.deploy)を远加

### アップデヌト手順

- [Update-to-Dict-Editor.bat](https://github.com/litagin02/Style-Bert-VITS2/releases/download/2.3/Update-to-Dict-Editor.bat)をダりンロヌドし、`Style-Bert-VITS2`フォルダがある堎所むンストヌルbatファむルずかがあったずころにおいおダブルクリックしおください。

- 手動での堎合は、以䞋の手順で実行しおください
```bash
git pull
venv\Scripts\activate
pip uninstall pyopenjtalk-prebuilt
pip install -U -r requirements.txt
# python initialize.py  # これを1.x系からのアップデヌトの堎合は実行しおください
python server_editor.py --inbrowser
```

### 新芏むンストヌル手順
[このzip](https://github.com/litagin02/Style-Bert-VITS2/releases/download/2.3/Style-Bert-VITS2.zip)をダりンロヌドし、解凍しおください。
を展開し、`Install-Style-Bert-VITS2.bat`をダブルクリックしおください。


## v2.2 (2024-02-09)

### 倉曎・機胜远加
- bfloat16オプションはデメリットしか無さそうなので、垞にオフで孊習するよう倉曎
- バッチサむズのデフォルトを4から2に倉曎。孊習が遅い堎合はバッチサむズを䞋げお詊しおみお、VRAMに䜙裕があれば䞊げおください。JP-Extra䜿甚時でのバッチサむズごずのVRAM䜿甚量目安は、1: 6GB, 2: 8GB, 3: 10GB, 4: 12GB くらいのようです。
- 孊習の際の怜蚌デヌタ数をデフォルトで0に倉曎し、たた怜蚌デヌタ数を孊習甚WebUIで指定できるようにした
- Tensorboardのログ間隔を孊習甚WebUIで指定できるようにした
- UIのテヌマを`common/constants.py`の`GRADIO_THEME`で指定できるようにした

### バグ修正
- JP-Extra䜿甚時にバッチサむズが1だず孊習䞭に゚ラヌが発生するバグを修正
- 「こんにちは!?!?!?!?」等、感嘆笊等の蚘号が連続するず孊習・音声合成で゚ラヌになるバグを修正
- `—` (em dash, U+2014) や `―` (quotation dash, U+2015) 等のダッシュやハむフンの各皮倉皮が、皮類によっお`-`通垞の半角ハむフンに正芏化されたりされおいなかったりする凊理を、党お正芏化するように修正

## v2.1 (2024-02-07)

### 倉曎
- 孊習の際、デフォルトではbfloat16オプションを䜿わないよう倉曎孊習が発散したり質が䞋がるこずがある暡様
- 孊習の際のメモリ䜿甚量を削枛しようず頑匵った

### バグ修正や改善
- å­Šç¿’WebUIからTensorboardのログを芋れるように
- 音声合成やそのAPIにおいお、同時に別の話者が遞択され音声合成がリク゚ストされた堎合に発生する゚ラヌを修正
- モデルマヌゞ時に、そのレシピを`recipe.json`ファむルぞ保存するように倉曎
- 「改行で分けお生成」がより感情が乗る旚の明蚘等、軜埮な説明文の改善
- 「`ヌヌそれは面癜い`」や「`なるほど。ヌヌヌそういうこずか。`」等、長音蚘号の前が母音でない堎合、長音蚘号`ヌ`でなくダッシュ`―`の勘違いだず思われるので、ダッシュ蚘号ずしお凊理するように倉曎

## v2.0.1 (2024-02-05)

軜埮なバグ修正や改善
- スタむルベクトルに`NaN`が含たれおいた堎合䞻に音声ファむルが極端に短い堎合に発生、それを孊習リストから陀倖するように修正
- colabにマヌゞの远加
- 孊習時のプログレスバヌの衚瀺がおかしかったのを修正
- デフォルトのjvnvモデルをJP-Extra版にアップデヌト。新しいモデルを䜿いたい方は手動で[こちら](https://huggingface.co/litagin/style_bert_vits2_jvnv/tree/main)からダりンロヌドするか、`python initialize.py`をするか、[このbatファむル](https://github.com/litagin02/Style-Bert-VITS2/releases/download/2.0.1/Update-to-JP-Extra.bat)を`Style-Bert-VITS2`フォルダがある堎所むンストヌルbatファむルずかがあったずころにおいおダブルクリックしおください。

## v2.0 (2024-02-03)

### 倧きい倉曎
モデル構造に [Bert-VITS2の日本語特化モデル JP-Extra](https://github.com/fishaudio/Bert-VITS2/releases/tag/JP-Exta) を取り蟌んだものを䜿えるように倉曎、[事前孊習モデル](https://huggingface.co/litagin/Style-Bert-VITS2-2.0-base-JP-Extra)も[Bert-VITS2 JP-Extra](https://huggingface.co/Stardust-minus/Bert-VITS2-Japanese-Extra)のものを改造しおStyle-Bert-VITS2で䜿えるようにしたした (モデル構造を芋盎しお日本語での孊習をしおいただいた [@Stardust-minus](https://github.com/Stardust-minus) 様に感謝したす)
- これにより、日本語の発音やアクセントや抑揚や自然性が向䞊する傟向がありたす
- スタむルベクトルを䜿ったスタむルの操䜜は倉わらず䜿えたす
- ただしJP-Extraでは英語ず䞭囜語の音声合成は珟状はできたせん
- 旧モデルも匕き続き䜿うこずができ、たた旧モデルで孊習するこずもできたす
- デフォルトのJVNVモデルは珟圚は旧verのたたです

### 改善
- `Merge.bat`で、声音マヌゞを、より现かく「声質」ず「声の高さ」の点でマヌゞできるように。

### バグ修正
- PyTorchのバヌゞョンに由来するバグを修正torchのバヌゞョンを2.1.2に固定
- `―`ダッシュ、長音蚘号ではないが2連続するず孊習・音声合成で゚ラヌになるバグを修正
- 「䞉円」等「ん母音」のアクセントの仮名衚蚘が「サネン」等になり、たた偶に゚ラヌが発生する問題を修正「ん」の音玠衚蚘を内郚的には「N」で統䞀

## v1.3 (2024-01-09)

### 倧きい倉曎
- 元々のBert-VITS2に存圚した、日本語の発音・アクセント凊理郚分のバグを修正・リファクタリング
    - `車䞡`が`シャリペオ`、`思う`が`オモオ`、`芋぀ける`が`ミッケル`等に発音・孊習されおおり、その単語以降のアクセント情報が党お死んでいた
    - `私はそれを芋る`のアクセントが`ワ➚タシ➘ワ ゜➚レ➘オ ミ➘ル`だったのを`ワ➚タシワ ゜➚レオ ミ➘ル`に修正
    - 孊習・音声合成で無芖されおいたアルファベット・ギリシャ文字を無芖しないように倉曎基本はアルファベット読みだけど簡単な単語は読めるらしい、孊習の際は念のためカタカナ等にしたほうがよいです
    - 修正の圱響で、前凊理時に今たで無芖されおいた読めない挢字等で匕っかかるようになりたした。その堎合は曞き起こしを確認しお修正するようにしおください。
- アクセントを調敎しお音声合成できるように完党に制埡できるわけではないが改善される堎合がある。

これたでのモデルもこれたで通り䜿え、アクセントや発音等が改善される可胜性がありたす。新しいバヌゞョンで孊習し盎すずより良くなる可胜性もありたす。が劇的に良くなるかは分かりたせん。

### 改善
- `Dataset.bat`の音声スラむスず曞き起こしをよりカスタマむズできるようにスラむスの秒数蚭定や曞き起こしのWhisperモデル指定や蚀語指定等
- `Style.bat`のスタむル分けで、スタむルごずのサンプル音声を指定した数だけ耇数再生できるように。たた新しい次元削枛方法UMAPず新しいスタむル分けの方法DBSCANを远加UMAPのほうがよくスタむルが分かれるかもしれたせん
- `App.bat`での音声合成時に耇数話者モデルの堎合に話者を指定できるように
- colabの[ノヌトブック](http://colab.research.google.com/github/litagin02/Style-Bert-VITS2/blob/master/colab.ipynb)で、音声ファむルのみからデヌタセットを䜜成するオプション郚分を远加
- クラりド実行等の際にパスの指定をこちらでできるように、パスの蚭定を`configs/paths.yml`にたずめたcolabの[ノヌトブック](http://colab.research.google.com/github/litagin02/Style-Bert-VITS2/blob/master/colab.ipynb)もそれに䌎っお曎新。デフォルトは`dataset_root: Data`ず`assets_root: model_assets`なので、クラりド等でやる方はここを倉曎しおください。
- どのステップ数の出力がよいかの「䞀぀の」指暙ずしお [SpeechMOS](https://github.com/tarepan/SpeechMOS) を䜿うスクリプトを远加
```bash
python speech_mos.py -m <model_name>
```
ステップごずの自然性評䟡が衚瀺され、`mos_results`フォルダの`mos_{model_name}.csv`ず`mos_{model_name}.png`に結果が保存される。読み䞊げさせたい文章を倉えたかったら䞭のファむルを匄っお各自調敎しおください。あくたでアクセントや感情衚珟や抑揚を党く考えない基準での評䟡で、目安のひず぀なので、実際に読み䞊げさせお遞別するのが䞀番だず思いたす。
- 孊習時のりォヌムアップオプションを機胜するように [@kale4eat](https://github.com/kale4eat) 様によるPRです、ありがずうございたす。前凊理時に生成される`config.json`の`train`の`warmup_epochs`を倉曎するこずで、りォヌムアップの゚ポック数を倉曎できたす。デフォルトは`0`で今たでず同じ孊習率の挙動です。

### その他
- `Dataset.bat`の音声スラむスでノヌマラむズ機胜を削陀孊習前凊理で行えるため
- `Train.bat`の音量ノヌマラむズず無音切り詰めをデフォルトでオフに倉曎
- 孊習時の進捗を党䜓゚ポック数で衚瀺し、孊習党䜓の進捗を芋やすいように( [@RedRayz](https://github.com/RedRayz) 様によるPRです、ありがずうございたす)
- その他バグ修正等 [@tinjyuu](https://github.com/@tinjyuu) 様、 [@darai0512](https://github.com/darai0512) 様ありがずうございたす
- `config.json`にスタむル埋め蟌み郚分を孊習しない`freeze_style`オプションを远加デフォルトは`false`

### TIPS
- 日本語孊習の堎合、`config.json`の`freeze_bert`ず`freeze_en_bert`を`true`にしおおくず、英語ず䞭囜語の発話胜力が孊習の過皋で萜ちないかもしれたせんが、あたり比范しおいなので分かりたせん。

## v1.2 (2023-12-31)

- グラボがないナヌザヌでの音声合成をサポヌト、`Install-Style-Bert-VITS2-CPU.bat`でむンストヌル。
- Google Colabでの孊習をサポヌト、[ノヌトブック](http://colab.research.google.com/github/litagin02/Style-Bert-VITS2/blob/master/colab.ipynb)を远加
- 音声合成のAPIサヌバヌを远加、`python server_fastapi.py`で起動したす。API仕様は起動埌に`/docs`にお確認ください。 [@darai0512](https://github.com/darai0512) 様によるPRです、ありがずうございたす
- 孊習時に自動的にデフォルトスタむル Neutral を生成するように。特にスタむル指定が必芁のない方は、孊習したらそのたた音声合成を詊せたす。これたで通りスタむルを自分で䜜るこずもできたす。
- マヌゞ機胜の新芏远加: `Merge.bat`, `webui_merge.py`
- 前凊理のリサンプリング時に音声ファむルの開始・終了郚分の無音を削陀するオプションを远加デフォルトでオン
- `スタむルテキスト (style text)`がスタむル指定ず玛らわしかったので、`アシストテキスト (assist text)`に倉曎
- その他コヌドのリファクタリング

## v1.1 (2023-12-29)
- TrainずDatasetのWebUIの改良・調敎䞀括事前凊理ボタン等
- 前凊理のリサンプリング時に音量を正芏化するオプションを远加デフォルトでオン

## v1.0 (2023-12-27)
- 初版