搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

强化学习笔记扫描件.pdf

里面是我自己的强化学习笔记。参考自刘建平老师的强化学习博客，再加上自己的理解，通俗易懂。里面包含了强化学习model-free是经典论文（Q-learning、SARSA、TD(lambda)、DQN、DDQN、prioritized replay DQN、Dueling DQN、policy gradient、AC、A2C、A3C、DDPG、TD3、TRPO、PPO），能帮助你快速入门。

2021-09-06 17:20:11 113.7MB 强化学习 深度学习 智能体

1

四轮独立转向电动汽车最优控制器设计.pdf

2021-09-05 18:07:50 195KB 电动汽车 新能源汽车 汽车技术 参考文献

基于神经网络的微分对策控制器设计

采用伴随-BP技术, 将微分对策的两点边值求解问题转化为两个神经网络的学习问题, 训练后的两个神经网络分别作为对策双方的最优控制器在线使用, 避免了直接求解复杂的两点边值问题。对追逃微分对策问题的仿真结果表明, 该方法对初始条件和噪声具有较好的鲁棒性。

2021-09-03 20:25:08 243KB 微分对策神经网络最优控制两点边值

1

2.3 Q Learning 思维决策 (强化学习 Reinforcement Learning 教学)

#2.3_Q_Learning_思维决策_(强化学习_Reinforcement_Learning_教学)

2021-09-01 22:00:21 22.82MB 学习资源

2.2 Q Learning 算法更新 (强化学习 Reinforcement Learning 教学)

#2.2_Q_Learning_算法更新__(强化学习_Reinforcement_Learning_教学)

2021-09-01 22:00:18 26.08MB 学习资源

2.1 简单例子 (强化学习 Reinforcement Learning 教学)

#2.1_简单例子__(强化学习_Reinforcement_Learning_教学)

2021-09-01 22:00:16 34.49MB 学习资源

2 要求准备 (强化学习 Reinforcement Learning 教学)

#2_要求准备__(强化学习_Reinforcement_Learning_教学)

2021-09-01 22:00:14 12.5MB 学习资源

1 why? (强化学习 Reinforcement Learning 教学)

#1_why__(强化学习_Reinforcement_Learning_教学)

2021-09-01 22:00:09 4.19MB 学习资源

6.4 PPO/DPPO Proximal Policy Optimization (强化学习 Reinforcement Learning with tensorflow 教学)

#6.4_PPO_DPPO_Proximal_Policy_Optimization_(强化学习_Reinforcement_L

2021-09-01 21:00:30 40.32MB 学习资源

6.3 A3C (Asynchronous Advantage Actor-Critic) (强化学习 Reinforcement Learning 教学)

#6.3_A3C_(Asynchronous_Advantage_Actor-Critic)_(强化学习_Reinforceme

2021-09-01 21:00:30 64.32MB 学习资源

个人信息

热门下载

最新下载

其他资源