首先,对面向高速公路自动驾驶决策的深度强化学习算法进行改进。分别 针对当前常用于自动驾驶决策的两种深度强化学习算法深度确定性策略梯度 (Deep Deterministic Policy Gradient,DDPG)和近端策略优化(Proximal Policy Optimization,PPO)进行改进,以使其更能满足高速公路自动驾驶场景 对于决策模块的要求。对于DDPG算法,本文对其进行针对性改进提出了基 于双评论家及优先回放机制的深度确定性策略梯度算法(Double Critic and Priority Experience Replay Deep Deterministic Policy Gradient,DCPER-DDPG)。 针对Q值过估计导致的驾驶策略效果下降问题,采用了双评论家网络进行优 化。针对演员网络更新时产生的时间差分误差导致算法模型不精准采用延迟更 新方法降低这一影响。针对DDPG算法中随机经验回放导致的采样样本效果 不符合预期和训练速度慢导致的算力和资源损耗,本文采用优先经验回放机制 对其进行改善。
2024-05-29 00:26:53 37.1MB 自动驾驶 强化学习 高速公路 决策规划
1
节能与新能源汽车产业发展规划.pdf
2024-05-24 11:18:59 272KB
1
①运动学正解:输入六个关节角度,输出位姿(x,y,z,gama,beta,alpha); ②运动学逆解:输入位姿(x,y,z,gama,beta,alpha),输出8组6个关节角度值; 轨迹规划代码包括了:③直线插补;④圆弧插补;⑤五次多项式轨迹规划; 五次多项式轨迹规划包括:点对点轨迹规划和多点间的轨迹规划;
2024-05-24 11:04:13 4.47MB 机器人运动学
1
C++从文件读取数据,利用动态规划实现01背包问题
2024-05-23 20:46:47 1KB 01背包问题 动态规划 c++实现
1
基于栅格法构建地图的Q-Learning路径规划python代码
2024-05-23 15:30:40 34KB python 强化学习 路径规划
1
百度Apollo学习:planning规划模块结构,数据,代码介绍
2024-05-22 01:17:18 2.21MB 自动驾驶 百度Apollo planning 代码介绍
1
软件工程师职业规划.pdf
2024-05-20 21:06:29 406KB 软件工程师职业规划
1
CSDN佛怒唐莲上传的视频均有对应的完整代码,皆可运行,亲测可用,适合小白; 1、代码压缩包内容 主函数:main.m; 调用函数:其他m文件;无需运行 运行结果效果图; 2、代码运行版本 Matlab 2019b;若运行有误,根据提示修改;若不会,私信博主; 3、运行操作步骤 步骤一:将所有文件放到Matlab的当前文件夹中; 步骤二:双击打开main.m文件; 步骤三:点击运行,等程序运行完得到结果; 4、仿真咨询 如需其他服务,可私信博主或扫描视频QQ名片; 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作
2024-05-16 15:50:58 1.88MB matlab
1
CSDN佛怒唐莲上传的视频均有对应的完整代码,皆可运行,亲测可用,适合小白; 1、代码压缩包内容 主函数:main.m; 调用函数:其他m文件;无需运行 运行结果效果图; 2、代码运行版本 Matlab 2019b;若运行有误,根据提示修改;若不会,私信博主; 3、运行操作步骤 步骤一:将所有文件放到Matlab的当前文件夹中; 步骤二:双击打开main.m文件; 步骤三:点击运行,等程序运行完得到结果; 4、仿真咨询 如需其他服务,可私信博主或扫描视频QQ名片; 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作
2024-05-13 19:29:51 2.6MB matlab
1