本文的研究内容主要包括数据库构建和算法研究两个方面,主要内容如下: (1)中文唇语识别数据集 LRW-1000 的构建:考虑到目前关于中文唇语识别的 研究尚无一个基准的数据库,为了给未来中文唇语识别的研究提供一个数据基准, 本课题根据自采的数据,与中科院计算所 VIPL 组合作构建了一个大型的开放场景下 中文唇语识别数据集,并提出了一个完整的构建流程,详细介绍了构建流程中的设 计到的算法原理。 (2)唇语识别算法:提出了一个新的唇语识别算法,来学习从唇语图像序列到 目标文本序列的映射。为了增强网络对短时依赖的建模能力,结合 DenseNet 和时空卷积提出一个新的网络结构,命名为 D3D。然后使用循环神经网络对得到特征的时 序关联进行学习。同时,针对特定的网络结构,设计了一个三段式的训练方法来解 决模型收敛不稳定的问题,该训练方式对于模型性能有显著提升。
2021-04-23 16:41:42 2.28MB 唇语识别
1
电力系统动态等值的人工智能方法的研究_罗敏.caj
2021-04-23 14:03:33 1.04MB 动态等值
1
基于广域量测数据的电力系统动态等值方法研究_王为超 (1).caj
2021-04-23 13:03:14 5.03MB 动态等值
1
双馈机组风电场动态等效模型研究_米增强.caj
2021-04-22 14:04:56 210KB 动态等值
1
基于红外热成像的消防灭火机器人自动控制系统的研究_张航.caj
2021-04-22 09:03:15 3.24MB 机器人
1
线激光视觉传感的机器人三维焊缝导引与跟踪控制研究
2021-04-21 18:10:05 4.06MB 机器视觉 焊缝识别 机器人
1
智能振动4_20ma信号变送器_朱海强_赵孟珂_张强_薛永亮.caj
2021-04-21 18:03:20 310KB 4-20mA
1
基于FPGA实现的SMS4算法研究_程海.caj
2021-04-20 12:34:25 657KB sm4
1
嵌入式数控插补系统速度规划研究及软件架构设计_余炼.caj
2021-04-18 09:02:08 2.80MB 插补算法 速度规划 嵌入式
1
开关电源的建模与仿真研究_王传芳
2021-04-17 18:05:44 4.80MB 信号与系统
1