基于强化学习的高速公路自动驾驶决策方法研究

上传者: 45905610 | 上传时间: 2024-05-29 00:26:53 | 文件大小: 37.1MB | 文件类型: PDF
首先,对面向高速公路自动驾驶决策的深度强化学习算法进行改进。分别 针对当前常用于自动驾驶决策的两种深度强化学习算法深度确定性策略梯度 (Deep Deterministic Policy Gradient,DDPG)和近端策略优化(Proximal Policy Optimization,PPO)进行改进,以使其更能满足高速公路自动驾驶场景 对于决策模块的要求。对于DDPG算法,本文对其进行针对性改进提出了基 于双评论家及优先回放机制的深度确定性策略梯度算法(Double Critic and Priority Experience Replay Deep Deterministic Policy Gradient,DCPER-DDPG)。 针对Q值过估计导致的驾驶策略效果下降问题,采用了双评论家网络进行优 化。针对演员网络更新时产生的时间差分误差导致算法模型不精准采用延迟更 新方法降低这一影响。针对DDPG算法中随机经验回放导致的采样样本效果 不符合预期和训练速度慢导致的算力和资源损耗,本文采用优先经验回放机制 对其进行改善。

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明