深度强化学习DDPG算法训练小车运动找球的代码
ddpg DDPG(深度确定性策略梯度)在Gym-torcs上的实现。 与张量流。 ddpg论文: ://arxiv.org/pdf/1509.02971v2.pdf 作者:肯尼斯·于 安装依赖项: 张量流r1.4 gym_torcs: : 如何运行: 训练方式: python3 gym_torcs_train_low_dim.py 评估模式: python3 gym_torcs_eval_low_dim.py
2021-06-21 11:48:03 30KB 附件源码 文章源码
1
I used the CNN + DDPG realizing inverted pendulum control python3.5 tensorflow + GPU gym环境。 本代码绝无仅有,自己用全连接修改的,输入的图像也是自己画的 其中CNN_1与CNN_2是根据全连接进行改造的 。 CNN_1中是在第二个卷积层的输出中加入Actor网络的输出Policy 。 CNN_2中是在第一个全连接的输出中加入Actor网络的输出Policy。
1