通过深度学习模型对室内楼道环境的视觉信息进行处理,帮助移动机器人在室内楼道环境下自主行走。为达到这个目的,将楼道环境对象分为路、门、窗户、消防栓、门把手和背景六类,通过图像的语义分割实现对象识别。在对楼道环境的六类对象进行分割的实验中发现,由于门把手比起其他对象小很多,影响了对它的识别效果;将六分类模型改为“5 2”分类模型,解决了这个问题。分类模型的基础是全卷积神经(FCN)网络,可以初步实现图像的分割。为了提高FCN网络的分割效果,从三个方面进行了实验研究:a)取出FCN网络的多个中间特征层,进行多层特征融合;b)考虑到移动机器人行走过程中视觉信息的时间序列特点,将递归神经网络(RNN)的结构纳入到FCN网络中,构成时间递归的t-LSTM网络;c)考虑到二维图像相邻像素之间的依赖关系,构成空间递归的s-LSTM网络。这些措施都有效地提高了图像的分割效果,实验结果表明,多层融合加s-LSTM的结构从分割效果和计算时间方面达到综合指标最佳。
1