MOCKINGBIRD支援3種語音資料庫結構,分別為(aidatatang_200zh、magicdata、aishell3)
1、下載
aidatatang_200zh: 網址 https://openslr.org/62/
magicdata: 網址 https://www.openslr.org/68/
aishell3: 網址 https://www.openslr.org/93/
2、解壓縮
擬訓練的DATAROOT若為E:\DATA
則將下載的語音庫解壓縮到E:\DATA目錄下
該語音庫會自動建立可供PRE.PY讀取的資料結構
3、訓練預處理
python pre.py e:\data -d aishell3
e:\data 是語音檔案解壓縮目的位置
-d aishell3 是告知pre.py此次訓練用的語音集資料結構為aishell3
省略其他參數則程式會在e:\data目錄下建立目錄SV2TTS,製作目錄放置訓練暫存檔
NOTICE:
A、python pre.py e:\data -d aishell3 -s 表示接續之前育訓練處理,可以將3個語音庫加入後再訓練合成器
B、迄今測試,單獨取出某一人的語音進行訓練比較快速達成收斂,LOSS:0.1-0.2。
4、合成器訓練
python synthesizer_train.py test e:\data\SV2TTS\synthesizer
參數參照步驟3
執行後會顯示檔案來源、目的位置。
....下期繼續...
請先 登入 以發表留言。