搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

为了帮助读者更加深入地理解深度强化学习细节，仔细地讲述了大量应用的实现细节，例如机器人学习跑步、机械臂控制、下围棋、多智能体平台

2022-02-21 09:28:29 175.22MB 深度学习 机器人

1

强化学习快速简单 Demo.zip

强化学习快速简单 Demo。.zip,最小和干净的强化学习示例

2022-02-19 00:55:51 65.2MB 开源项目

1

(变分法在最优控制问题中的一个应用

最优控制

2022-02-18 21:21:11 184KB 最优控制

1

Google DeepMind的David Silver的强化学习课程讲义(完整版)

Google DeepMind的David Silver的强化学习课程讲义(pdf完整版)

2022-02-18 09:12:26 20.35MB 强化学习 DeepMind David Sliver

1

写出哈密顿函数-线性系统二次型指标的最优控制

写出哈密顿函数协态方程、为半正定阵，为正定阵。要求寻找最优控制序列，使最小。（5-54）（5-55）

2022-02-15 16:05:14 1.85MB 线性系统 二次型 最优控制

1

强化学习 Q-learning

智能Agent 的主要特征之一就是能够适应未知环境，而在这一过程中，主动学习是至关重要的。在机器学习领域，大致可以将学习分为监督学习、非监督学习和强化学习3 大类。

2022-02-14 17:26:48 411KB 强化学习

1

强化学习(reinforcement learning)

一本关于强化学习很好的教材，附带代码，非常值得拥有！

2022-02-14 10:02:39 19.13MB 强化学习

1

深度强化学习——DQN

本文来自于csdn，本文章主要介绍了深度学习与强化学习结合起来从而实现从感知（Perception）到动作（Action）的端对端（End-to-end）学习的一种全新的算法。原因：在普通的Q-learning中，当状态和动作空间是离散且维数不高时可使用Q-Table储存每个状态动作对的Q值，而当状态和动作空间是高维连续时，使用Q-Table不现实。通常做法是把Q-Table的更新问题变成一个函数拟合问题，相近的状态得到相近的输出动作。如下式，通过更新参数θθ使Q函数逼近最优Q值而深度神经网络可以自动提取复杂特征，因此，面对高维且连续的状态使用深度神经网络最合适不过了。DRL是将深度学习（DL

2022-02-14 00:41:48 395KB 深度强化学习——DQN

1

最优控制理论

控制类的专业书籍，很权威！

2022-02-11 18:49:23 4.53MB 最优控制理论

1

随机最优控制部分.docx

44444444444444444444444444444444

2022-02-03 14:01:15 150KB 4444444444444444

1

个人信息

热门下载

最新下载

其他资源