MOCKINGBIRD支援3種語音資料庫結構,分別為(aidatatang_200zh、magicdata、aishell3)

1、下載

aidatatang_200zh: 網址  https://openslr.org/62/

magicdata: 網址  https://www.openslr.org/68/

aishell3: 網址 https://www.openslr.org/93/

2、解壓縮

擬訓練的DATAROOT若為E:\DATA

則將下載的語音庫解壓縮到E:\DATA目錄下

該語音庫會自動建立可供PRE.PY讀取的資料結構

3、訓練預處理

python pre.py e:\data -d aishell3

e:\data 是語音檔案解壓縮目的位置

-d aishell3 是告知pre.py此次訓練用的語音集資料結構為aishell3

省略其他參數則程式會在e:\data目錄下建立目錄SV2TTS,製作目錄放置訓練暫存檔

NOTICE:

        A、python pre.py e:\data -d aishell3 -s 表示接續之前育訓練處理,可以將3個語音庫加入後再訓練合成器

       B、迄今測試,單獨取出某一人的語音進行訓練比較快速達成收斂,LOSS:0.1-0.2。

4、合成器訓練

python synthesizer_train.py test e:\data\SV2TTS\synthesizer

參數參照步驟3

執行後會顯示檔案來源、目的位置。

....下期繼續...

創作者介紹
創作者 Working Notes-My Work Diary 的頭像
laizhucheng

Working Notes-My Work Diary

laizhucheng 發表在 痞客邦 留言(0) 人氣( 1 )