高速公路环境 自动驾驶和战术决策任务的环境集合 高速公路环境中可用环境之一的一集。 环境 高速公路 env = gym . make ( "highway-v0" ) 在这项任务中,自我车辆正在一条多车道高速公路上行驶,该高速公路上挤满了其他车辆。 代理的目标是达到高速,同时避免与相邻车辆发生碰撞。 在道路右侧行驶也有奖励。 高速公路-v0 环境。 合并 env = gym . make ( "merge-v0" ) 在这项任务中,自我车辆从主干道开始,但很快就会接近路口,进入坡道上的车辆。 代理现在的目标是保持高速,同时为车辆腾出空间,以便它们可以安全地并入交通。 merge-v0 环境。 迂回 env = gym . make ( "roundabout-v0" ) 在此任务中,自我车辆是否接近交通流量较大的环形交叉路口。 它将自动遵循其计划路线,但必须处理车
1
动手使用Python进行元学习:使用Tensorflow使用一键式学习,MAML,爬行动物,Meta-SGD等进行学习学习
1
#2.3_Q_Learning_思维决策_(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:21 22.82MB 学习资源
#2.2_Q_Learning_算法更新__(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:18 26.08MB 学习资源
#2.1_简单例子__(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:16 34.49MB 学习资源
#2_要求准备__(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:14 12.5MB 学习资源
#1_why__(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:09 4.19MB 学习资源
#6.4_PPO_DPPO_Proximal_Policy_Optimization_(强化学习_Reinforcement_L
2021-09-01 21:00:30 40.32MB 学习资源
#6.3_A3C_(Asynchronous_Advantage_Actor-Critic)_(强化学习_Reinforceme
2021-09-01 21:00:30 64.32MB 学习资源
#6.2_DDPG_(Deep_Deterministic_Policy_Gradient)_(强化学习_Reinforceme
2021-09-01 21:00:29 44.8MB 学习资源