本文的研究内容主要包括数据库构建和算法研究两个方面,主要内容如下: (1)中文唇识别数据集 LRW-1000 的构建:考虑到目前关于中文唇识别的 研究尚无一个基准的数据库,为了给未来中文唇识别的研究提供一个数据基准, 本课题根据自采的数据,与中科院计算所 VIPL 组合作构建了一个大型的开放场景下 中文唇识别数据集,并提出了一个完整的构建流程,详细介绍了构建流程中的设 计到的算法原理。 (2)唇识别算法:提出了一个新的唇识别算法,来学习从唇图像序列到 目标文本序列的映射。为了增强网络对短时依赖的建模能力,结合 DenseNet 和时空卷积提出一个新的网络结构,命名为 D3D。然后使用循环神经网络对得到特征的时 序关联进行学习。同时,针对特定的网络结构,设计了一个三段式的训练方法来解 决模型收敛不稳定的问题,该训练方式对于模型性能有显著提升。
2021-04-23 16:41:42 2.28MB 唇语识别
1
基于Thinkphp开发的ACCOIN数字金融虚拟币交易自动挖矿网站源码(中英韩三完美无错运营版),内附安装说明
2021-04-22 09:02:14 15.21MB 数字金融 虚拟币交易 自动挖矿源码
data_AI_shell中文音数据集合8data_AI_shell中文音数据集合2data_AI_shell中文音数据集合1data_AI_shell中文音数据集合1
2021-04-21 20:52:37 929.51MB data_AI_shell中文语
1
近年来,随着社会生活水平的不断提高,人们对机器智能人声识别的要求越来越高。高斯混合—隐马尔可夫模型(Gaussian of mixture-hidden Markov model, GMM-HMM)是说话人识别研究领域中最重要的模型。由于该模型对大音数据的建模能力不是很好,对噪声的顽健性也比较差,模型的发展遇到了瓶颈。为了解决该问题,研究者开始关注深度学习技术。引入了CNN深度学习模型研究连续音说话人识别问题,并提出了CNN连续说话人识别(continuous speaker recognition of convolutional neural network, CSR-CNN)算法。模型提取固定长度、符合序的音片段,形成时间线上的有序谱图,通过CNN提取特征序列,经过奖惩函数对特征序列组合进行连续测量。实验结果表明,CSR-CNN算法在连续—片段说话人识别领域取得了比GMM-HMM更好的识别效果。
2021-04-21 20:40:30 1.29MB 连续语音 语谱图 GMM-HMM 深度学习
1
嗨推视频号操盘手星-视频号带货180万路径解析.pdf
2021-04-21 09:03:52 3.20MB 私域 2021
大三 操作系统课设 报告
2021-04-19 18:48:57 140KB 操作系统 课设 实验报告
1
翻译器,普通文本核兽互译,恶搞软件
2021-04-18 22:02:59 7KB 兽语翻译
1
筑:上海风筑文化科技股份有限公司2020年年度报告.PDF
2021-04-16 09:05:43 3.85MB 年度报告
设计一个商品进销管理程序,该程序具有以下功能: (1) 录入商品信息; (2) 给定商品编号,修改该商品信息; (3) 给定商品编号,删除该商品信息; (4) 录入商品的进货和销售信息; (5) 给定商品编号或商品名,查看该商品及库存信息; (6) 统计功能:提供一些统计各类信息的功能。 1.1、设计要求 (1) 按照分析、设计、编码、调试和测试过程完成应用程序; (2) 学习并使用流程图等工具,并在撰写报告中使用; (3) 程序的各项功能在程序运行时,以菜单形式选择并执行; (4) 要求用户输入数据时,要给出清晰、明确的提示,包括:输入数据的内容、格式及其结束方式等 (5) 所有的信息存储在一个文件或多个中,并实现文件读写操作。 (6) 程序中用链表存放商品及进销存信息并实现增删减功能。 1.2、设计提示
1
windows 7 系统下实现维吾尔输入
2021-04-15 15:21:06 2.19MB alkatip
1