对抗性纠缠的视听表示形式的会说话人脸生成
在这项工作中,我们提出了Disentangled Audio-Visual System (DAVS)来解决任意主题的说话人脸的生成问题,该目的是合成与给定语音语义相对应的一系列人脸图像,并以不受约束的语音音频或视频为条件。
要求
(我们使用版本0.2.0)
生成测试结果
下载预训练的模型
Create the default folder " checkpoints " and put the checkpoint in it or get the CHECKPOINT_PATH
可在名为文件夹中找到测试样本。 这是来自数据集的预处理样本。
运行测试脚本以从视频生成视频:
python test_all.py --test_root ./0572_0019_0003/video --test_type video --test_au
2022-05-19 10:06:31
5.88MB
Python
1