人机交互是计算机科学、心理学、认知科学的交叉研究领域。近年来人机交互正逐渐地从以计
算机为中心转移到以人为中心。传统的人机交互方式(键盘、鼠标等)已很难满足人们日益增长的
需求。手势识别和表情识别作为自然的、符合直觉的人机交互方式,是近年来十分热门的研究方向。
本文研究了基于NAO机器人的手势识别和表情识别,并用于进行人机交互。
本文的主要内容如下:
首先,介绍了手势识别和表情识别的研究方法和研究现状,并分析了目前存在一些难点,比如
泛化能力较差、难以实用等。
其次,先介绍了卷积神经网络(ConvolutionalNeuralNetworks,CNN)的基本原理,然后介绍了
本文采用的手势识别算法的两个主要部分:基于全卷积神经网络(Fully convolutional network,FCN)
的手部分割算法和基于卷积神经网络的手势识别算法。该算法可识别10种手势。FCN实现了手部的
像素级精确分割,使得手势的识别更加容易,同时减少了对样本数的要求。
再次,先介绍了常见的视频识别算法,然后介绍了本文采用的基于光流卷积神经网络的表情识
别算法,可识别7种表情。使用稠密光流提取表情的动态特征可以减少对卷积神经网络提取特征的
要求,以及对样本数的要求。
最后,对这两个算法的各个环节分别进行了实验,并对实验结果进行了分析和总结。测试集上
手势识别的错误率为2.35%,表情识别的错误率为3.17%,并证明了算法的鲁棒性。在NAO机器人
平台上的实际使用效果评估进一步证明了基于手势识别和表情识别的人机交互的可行性。
2022-01-07 13:35:02
26.05MB
机器人
1