Python实现走迷宫,迷宫环境可视化,代码参考莫烦python,可以直接运行,DQN网络使用tensorflow搭建,代码注释非常全,基本每一句都有,而且可以使用tensorboard查看日志,需要将log_out参数设置为true
2021-04-27 17:03:12 14KB DQN 强化学习 机器学习 走迷宫
1
视觉推送和抓取工具箱 视觉推送和抓取(VPG)是一种训练机器人代理以学习如何计划互补的推送和抓取操作以进行操纵(例如,用于非结构化的放置和放置应用程序)的方法。 VPG直接在视觉观察(RGB-D图像)上运行,从试错中学习,快速训练,并推广到新的对象和场景。 该存储库提供PyTorch代码,用于在UR5机械臂的模拟和实际设置中通过深度强化学习来训练和测试VPG策略。 这是本文的参考实现: 通过自我监督的深度强化学习来学习推动和抓握之间的协同作用 , ,( ,( ,( ,( 2018年IEEE / RSJ国际智能机器人和系统国际会议(IROS) 熟练的机械手操作得益于非灵活(例如推
1
sutton强化学习随书MATLAB代码,内附使用说明,亲测可运行,对理解书中内容很有帮助。
2021-04-26 22:00:39 164KB sutton 强化学习 MATLAB 代码
1
The main purpose of this book is to introduce the recently developed framework, known as robust adaptive dynamic programming (RADP), for datadriven, nonmodel-based adaptive optimal control design for both linear and nonlinear continuous-time systems
2021-04-26 10:43:09 3.93MB 动态规划 强化学习
1
强化学习实战系列(2020最新)视频教程分享,完整版,附源码+数据集,百度网盘下载,希望大家喜欢
2021-04-25 19:09:22 313B 深度学习 强化学习
1
OpenAIGym练习可以提高我的RL技能。 这是我与TAMU CESG一起进行的本科研究工作的一部分。 除了解决诸如CartPole和Breakout之类的具体练习之外,我还将实施Deep Q Networks,以更好地了解它们的工作方式。
2021-04-25 16:37:55 8KB Python
1
DiskSetting.exe
2021-04-23 20:00:18 776KB 强化学习
1
2010年下半年2信息处理技术员.pdf
2021-04-23 20:00:18 600KB 强化学习
1
本资料为学徒学习大牛的博士论文,该论文通过提供专家策略,利用逆强化学习的方式,快速学习到媲美专家策略的新策略。
2021-04-22 21:30:18 25.14MB 逆强化学习 学徒学习 强化学习 创始人
1
《强化学习(第2版)》英文版,作为强化学习思想的深度解剖之作,被业内公认为是一本强化学习基础理论的经典著作。它从强化学习的基本思想出发,深入浅出又严谨细致地介绍了马尔可夫决策过程、蒙特卡洛方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法,并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。
2021-04-22 20:44:20 10.34MB 强化学习 英文版 Richard S.
1