上传者: zhr_the_great
|
上传时间: 2022-11-08 00:10:50
|
文件大小: 2.1MB
|
文件类型: PDF
近年来唇语识别成为了人机交互的黑科技,融合了机器视觉与自然语言处
理技术,在语音识别、人机智能交互、安防和公益等领域有着重要的实用价值
和理论意义,发展前景十分广阔。
唇语识别的研究离不开数据集,而国内目前还没有可用的中文唇语数据集,
因此,设计实现一个面向唇语识别的数据采集系统将会具有重要的实用价值。本
文首创性地设计实现了一个面向中文唇语识别的数据采集系统,用语音识别提取
视频的文字和对应的时间戳信息,再按词语进行视频切割并分割提取唇形,将其
与文字相对应,准确率超过 95%,与 DeepMind 团队提出的英文唇语识别数据采
集系统性能进行分析比较,得出了本系统性能更好的结论。