会说话的头 描述 该项目是的PyTorch实施。 在本文中,对GAN进行了设计和培训,可以从仅几张头像(可能只有一张)和面部表情中复制出真实的会说话的头部模型。 该论文解释了该模型的体系结构,但是缺少许多细节,并且没有发布正式的实现或受过训练的模型。 当前,仅实施了元培训过程,并且运行良好。 微调过程即将到来! 感谢社区帮助使该模型正常工作! 更多实施细节 在继续阅读之前,请阅读原始论文。 数据集 Talking Heads模型是使用数据集进行训练的。 该数据集是公开可用的,但是要下载它,您需要填写Google Docs请求访问。 训练集包含约140k的摇头视频(并非所有人都是不同的人)。 下载 该下载文件包含9个文件,每个文件约30GB。 直接从他们的服务器下载速度太慢,因此我们强烈建议您下载他们在Google云端硬盘中拥有的版本,该版本的下载速度约为25MB / s。 您可以使用
2022-08-24 14:28:25 32KB Python
1
#Talking Heads-Blender Addon ###这是什么? 当然,这是Blender的插件(也是我论文的一部分)。 这是一组简单的工具,可简化唇形同步的工作。 目前,Blender尚没有像Voice-o-Matic这样的100%可自动运行的口型同步系统。 不,不,不,此插件也不是100%可用的工具。 这是将来要开发的基本设备。 我衷心希望也许有人会对这个主题表达兴趣,并且我们最终将为未来的Blender创建一个真正的,独特的,百万分之一的系统,用于自动口型同步。 现在,我们有这个! 会说话的头! 啊,你问,为什么要“说话的人”? 这个名字是为了纪念我在使用此插件-Head.blend时的辛苦工作。 您也可以在这里找到她,如果您想查看我的插件,她特别好-她主要是用我的插件制作的。 这个名字也被《辐射》(Fallout)游戏中的“会说话的人”(Talking Heads)
2022-08-19 10:10:09 2.31MB Python
1
Talking Translator 2.3.2,体化的解决方案适用于任何人,任何地方,凭借其即时翻译功能,应用程序将帮助你在任何多语言环境中进行沟通,如旅行、商务旅行、买方会议,或只是普通对话。 真正的沟通从尊重开始 试试Talking Translator应用程序,它适合你和你的伙伴,具有创新的实时 "共享视图 "功能。对方肯定会感谢你在与他们交谈时的考虑。 1秒内完成#实时#即时#翻译! 语音识别在运行应用程序时首先出现,并在你需要现场翻译时帮助你,即使是在不稳定的网络连接下。你可以通过语音识别历史查看你以前的句子。 支持多国语言 你可以用这一个应用程序翻译100多种语言。Talking Translator!不知道如何读懂句子?没问题!它提供了一个手写句子。Talking Translator提供了手写的文字翻译。 支持100多种语言,包括英语、中文、越南语、日语、俄语、泰语、西班牙语、法语、印度尼西亚语和阿拉伯语。 口译、翻译、复制、收藏...你还想要什么? 我们提供了各种功能。除了翻译、口译、收藏、复制和分享,你还可以通过★缩放(霓虹灯)功能轻松地与远方的人交流
2022-05-29 14:04:51 37.88MB android 源码软件
1
对抗性纠缠的视听表示形式的会说话人脸生成 在这项工作中,我们提出了Disentangled Audio-Visual System (DAVS)来解决任意主题的说话人脸的生成问题,该目的是合成与给定语音语义相对应的一系列人脸图像,并以不受约束的语音音频或视频为条件。 要求 (我们使用版本0.2.0) 生成测试结果 下载预训练的模型 Create the default folder " checkpoints " and put the checkpoint in it or get the CHECKPOINT_PATH 可在名为文件夹中找到测试样本。 这是来自数据集的预处理样本。 运行测试脚本以从视频生成视频: python test_all.py --test_root ./0572_0019_0003/video --test_type video --test_au
2022-05-19 10:06:31 5.88MB Python
1
通过隐式模块化视听表示进行姿势可控的会说话脸生成(CVPR 2021) ,孙亚生,,,和。 | | 我们提出了可姿势控制的视听系统(PC-AVS) ,该系统可在驱动带有声音的任意说话的面部时实现自由姿势控制。 代替从音频中学习姿势运动,我们利用另一个姿势源视频来仅补偿头部运动。 关键是设计一种隐含的低维姿势代码,该代码不包含嘴巴形状或身份信息。 通过这种方式,将视听表示模块化为三个关键因素的空间:语音内容,头部姿势和身份信息。 要求 使用Python 3.6和 1.3.0。 基本要求在“ requirements.txt”中列出。 pip install -r requirements.txt 快速入门:生成演示结果 下载预训练的检查点。 创建默认的文件夹./checkpoints并解压demo.zip在./checkpoints/demo 。 其中应该有5 pth 。 解压缩mi
2022-05-18 16:34:32 28.48MB Python
1
Talking about Android Message Queue
2022-05-02 09:05:37 27KB android
1
Talking about Android process
2022-05-02 09:05:37 137KB android 源码软件
1
我的汤姆猫 2「My Talking Tom 2」 v2.5.0.9 for Android 一款火爆全球的新游戏
2021-06-18 17:00:50 117.35MB 我的汤姆猫2「MyTalki
obi:Obi是一种开源有声读物制作工具,可生成符合DAISY 3(ANSINISO Z39.86),DAISY 2.02和Accessible EPUB 3标准的数字有声读物(DTB)。它易于学习,易于访问且功能强大,可导航的有声读物制作工具,使任何人都可以通过最少的培训就可以制作出易于访问且内容丰富的内容。
2021-06-07 14:42:46 240.01MB audio books tts talking
1