实时语音克隆
该存储库是通过实时工作的声码器实现的(SV2TTS)的实现。 如果您好奇或正在寻找我未记录的信息,请随时检查。 通常,我建议您快速浏览一下引言之外的数字。
SV2TTS是一个三阶段的深度学习框架,它允许从几秒钟的音频中创建语音的数字表示,并使用它来调节经过训练的文本到语音模型,以推广到新的语音。
视频演示(单击图片):
已实施文件
网址
指定
标题
实施源
SV2TTS
将学习从演讲者验证转移到多演讲者语音合成
这个回购
WaveRNN(声码器)
高效的神经音频合成
Tacotron 2(合成器)
基于梅尔谱图预测的条件波网自然合成TTS
GE2E(编码器)
说话人验证的一般端到端损失
这个回购
消息
19/11/11 :我现在全职工作,因此我将不再维护此仓库。 对于阅读此内容的任何人:
如果您只想克隆自己的声音,请在上检查我们的演示-它会比此回购提供更
2021-10-29 23:22:18
18.16MB
Python
1