MOCKINGBIRD克隆語音的數據集

MOCKINGBIRD支援3種語音資料庫結構，分別為（aidatatang_200zh、magicdata、aishell3）

1、下載

aidatatang_200zh: 網址 https://openslr.org/62/

magicdata: 網址 https://www.openslr.org/68/

aishell3: 網址 https://www.openslr.org/93/

2、解壓縮

擬訓練的DATAROOT若為E:\DATA

則將下載的語音庫解壓縮到E:\DATA目錄下

該語音庫會自動建立可供PRE.PY讀取的資料結構

3、訓練預處理

python pre.py e:\data -d aishell3

e:\data 是語音檔案解壓縮目的位置

-d aishell3 是告知pre.py此次訓練用的語音集資料結構為aishell3

省略其他參數則程式會在e:\data目錄下建立目錄SV2TTS，製作目錄放置訓練暫存檔

NOTICE:

A、python pre.py e:\data -d aishell3 -s 表示接續之前育訓練處理，可以將3個語音庫加入後再訓練合成器

B、迄今測試，單獨取出某一人的語音進行訓練比較快速達成收斂，LOSS:0.1-0.2。

4、合成器訓練

python synthesizer_train.py test e:\data\SV2TTS\synthesizer

參數參照步驟3

執行後會顯示檔案來源、目的位置。

....下期繼續...

laizhucheng

Working Notes-My Work Diary

laizhucheng 發表在痞客邦留言(0) 人氣( 1 )

▲top

請先登入以發表留言。

Working Notes-My Work Diary