为了帮助读者更加深入地理解深度强化学习细节,仔细地讲述了大量应用的实现细节,例如机器人学习跑步、机械臂控制、下围棋、多智能体平台
2022-02-21 09:28:29 175.22MB 深度学习 机器人
1
强化学习快速简单 Demo。.zip,最小和干净的强化学习示例
2022-02-19 00:55:51 65.2MB 开源项目
1
最优控制
2022-02-18 21:21:11 184KB 最优控制
1
Google DeepMind的David Silver的强化学习课程讲义(pdf完整版)
2022-02-18 09:12:26 20.35MB 强化学习 DeepMind David Sliver
1
写出哈密顿函数 协态方程 、 为半正定阵, 为正定阵。要求寻找最优控制序列 ,使 最小。 (5-54) (5-55)
2022-02-15 16:05:14 1.85MB 线性系统 二次型 最优控制
1
智能Agent 的主要特征之一就是能够适应未知环境,而在这一过程中,主动学习是至关重要的。在机器学习领域,大致可以将学习分为监督学习、非监督学习和强化学习3 大类。
2022-02-14 17:26:48 411KB 强化学习
1
一本关于强化学习很好的教材,附带代码,非常值得拥有!
2022-02-14 10:02:39 19.13MB 强化学习
1
本文来自于csdn,本文章主要介绍了深度学习与强化学习结合起来从而实现从感知(Perception)到动作(Action)的端对端(End-to-end)学习的一种全新的算法。原因:在普通的Q-learning中,当状态和动作空间是离散且维数不高时可使用Q-Table储存每个状态动作对的Q值,而当状态和动作空间是高维连续时,使用Q-Table不现实。通常做法是把Q-Table的更新问题变成一个函数拟合问题,相近的状态得到相近的输出动作。如下式,通过更新参数θθ使Q函数逼近最优Q值而深度神经网络可以自动提取复杂特征,因此,面对高维且连续的状态使用深度神经网络最合适不过了。DRL是将深度学习(DL
2022-02-14 00:41:48 395KB 深度强化学习——DQN
1
控制类的专业书籍,很权威!
2022-02-11 18:49:23 4.53MB 最优控制理论
1
44444444444444444444444444444444
2022-02-03 14:01:15 150KB 4444444444444444
1