更新:如果您正在寻找Wav2Lip,
Lip2Wav
仅通过唇部动作即可产生高质量的语音。该代码是论文的一部分:在CVPR'20上发表的论文,学习个人说话风格以实现准确的语音合成。
| |
最近更新
发布了适用于所有扬声器的数据集和预训练模型!
已发布在LRW数据集上训练的多扬声器单词级Lip2Wav模型的预训练模型! (分支)
强调
在不受限制的情况下,仅通过嘴唇运动即可产生可理解的语音的第一项工作。
问题的序列到序列建模。
提供5个扬声器的数据集,其中包含100多个小时的视频数据!
提供了完整的培训代码和预训练的模型。
推理代码从预训练的模型生成结果。
还提供了用于计算论文中报告的指标的代码。
你也可能对此有兴趣:
:party_popper:使用Wav2Lip进行口语同步的语音视频到任何语音: :
先决条件
Python 3.7.4 (此版本已通过代码测试)
ffmpeg: sudo apt
2023-01-26 10:49:42
3.83MB
Python
1