手势识别的目的是识别人体有意义的动作,在智能人机交互中至关重要。本文提出了一种基于三维卷积和卷积长短时记忆(LSTM)网络的多模态手势识别方法。该方法首先通过三维卷积神经网络学习手势的短期时空特征,然后在提取的短期时空特征的基础上,通过卷积LSTM网络学习长期时空特征。此外,我们评估了多模态数据之间的微调,我们发现,当没有预先训练的模型存在时,它可以被视为一种可选的技能,以防止过拟合。在ChaLearn LAP大规模孤立手势数据集(IsoGD)和Sheffield Kinect手势数据集(SKIG)上对该方法进行了验证。结果表明,该方法在IsoGD验证集上的识别准确率为51.02%,在SKIG验证集上的识别准确率为98.89%。
3d卷积,卷积LSTM,手势识别,多模态
2022-02-07 14:03:36
529KB
多模态手势识