里面是我自己的强化学习笔记。参考自刘建平老师的强化学习博客,再加上自己的理解,通俗易懂。里面包含了强化学习model-free是经典论文(Q-learning、SARSA、TD(lambda)、DQN、DDQN、prioritized replay DQN、Dueling DQN、policy gradient、AC、A2C、A3C、DDPG、TD3、TRPO、PPO),能帮助你快速入门。
2021-09-06 17:20:11 113.7MB 强化学习 深度学习 智能体
1
四轮独立转向电动汽车最优控制器设计.pdf
采用伴随-BP技术, 将微分对策的两点边值求解问题转化为两个神经网络的学习问题, 训练后 的两个神经网络分别作为对策双方的最优控制器在线使用, 避免了直接求解复杂的两点边值问题。对追 逃微分对策问题的仿真结果表明, 该方法对初始条件和噪声具有较好的鲁棒性。
1
#2.3_Q_Learning_思维决策_(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:21 22.82MB 学习资源
#2.2_Q_Learning_算法更新__(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:18 26.08MB 学习资源
#2.1_简单例子__(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:16 34.49MB 学习资源
#2_要求准备__(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:14 12.5MB 学习资源
#1_why__(强化学习_Reinforcement_Learning_教学)
2021-09-01 22:00:09 4.19MB 学习资源
#6.4_PPO_DPPO_Proximal_Policy_Optimization_(强化学习_Reinforcement_L
2021-09-01 21:00:30 40.32MB 学习资源
#6.3_A3C_(Asynchronous_Advantage_Actor-Critic)_(强化学习_Reinforceme
2021-09-01 21:00:30 64.32MB 学习资源