-深度强化学习已成功应用于各种电脑游戏[8]。然而,它在实际应用中仍然很少使用,尤其是在实际移动机器人的导航和连续控制中[13]。以前的方法缺乏安全性和鲁棒性,并且/或者需要一个结构化的环境。在本文中,我们提出了一种在未知环境下,无地图或规划器的真实机器人自主自学习导航的概念证明。机器人的输入仅仅是来自2D激光扫描仪和RGB-D相机的融合数据,以及目标的方向。环境地图是未知的。异步网络(GA3C)的输出动作是机器人的线性速度和角速度。
导航/控制器网络在一个高速、并行、自实现的仿真环境中进行预训练,以加快学习过程,然后部署到实际机器人上。为了避免过度拟合,我们训练相对较小的网络,并向输入激光数据中添加随机高斯噪声。传感器数据与RGB-D摄像头的融合使机器人能够在真实环境中进行导航,实现真正的3D避障,而无需使环境适应机器人的感官能力。
为了进一步提高鲁棒性,我们在各种困难的环境中进行训练,并同时运行32个训练实例
2022-01-30 09:05:32
107.93MB
自主机器人