部分基于以下项目的的 PyTorch 实现:
(音频预处理)
(数据加载器采样器)
在线文字转语音演示
以下笔记本可在上执行:
对于音频样本和预训练模型,请访问上面的笔记本链接。
训练/合成英语文本到语音
英语 TTS 使用数据集。
下载数据集: python dl_and_preprop_dataset.py --dataset=ljspeech
训练 Text2Mel 模型: python train-text2mel.py --dataset=ljspeech
训练 SSRN 模型: python train-ssrn.py --dataset=ljspeech
合成句子: python synthesize.py --dataset=ljspeech WAV 文件保存在samples文件夹中。
训练/合成蒙古语文本到语音
蒙古语文本转语音使用来自5 小时音频。
1