深度神经网络在静态图像领域已取得突破性进展,并逐步扩展到视频识别领域。人体动作识别是视频识别领域的研究热点和难点,因此,提出了一种基于双流快速区域卷积神经网络(Faster RCNN)改进的人体动作识别算法。首先,用RGB(Red,Green,Blue)图像和光流数据作为网络的输入,分别训练Faster RCNN;然后,将训练好后的网络模型进行融合,并引入改进的压缩和激励模块对特征通道进行处理,以突出重要特征;最后,用完全的交并比损失函数作为边框回归损失函数,以优化某些预测框与真实框不能相交等问题。实验结果表明,相比传统的Faster RCNN,本算法在动作识别数据集UCF101上的准确率得到了一定的提高。
2022-05-05 10:24:52 2.69MB 机器视觉 双流快速 人体动作 压缩与激
1