搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

基于python的强化学习斗地主设计与实现

2022-04-15 13:17:14 12.4MB python 开发语言

二维插值函数：c=f(a,b)，Matlab版本，网上的代码有问题，已纠正，该程序可应用于工业控制中，如热效率计算，通过温压焓值表进行插值计算，得到某个温度压力下的焓值。该代码函数均自己编写，没有用到Matlab中的函数。所以可将Matlab代码转换成C/C++。

2022-04-15 13:16:47 1KB 二维、二元插值法 自定义MATLAB函数 c=f(ab)

matlab强化学习工具箱2019b

2022-04-15 09:39:22 5.43MB matlab 开发语言

1

深度强化学习求解动态柔性作业车间调度问题

2022-04-15 09:10:29 2.85MB DRL 深度强化学习 车间调度 柔性作业车间调度

Riccati代数方程:-线性二次型最优控制

Riccati代数方程: x1(t) - x2(t) +

2022-04-14 17:08:59 1.24MB 线性二次型 最优控制

1

国科大强化学习18-19春季.rar

2016年AlphaGo战胜人类顶级围棋选手，标志人工智能的一个重要里程碑事件，其中强化学习方法做出了重要的贡献。麻省理工、斯坦福、卡内基梅隆等著名学府纷纷开设或着重强化学习的课程。强化学习是人工智能中最活跃的研究领域之一。强化学习不同于监督学习，强化学习根据系统的状态做出动作，由环境给出奖惩信号，通过学习获得使累计奖惩最高的动作策略。也就是一种基于数据通过自学习方式获得最优决策和控制的方法。在棋类博弈、智能驾驶、机器人控制等领域都有广泛成功的应用。 R. Sutton和A. Barto的《强化学习导论》自1998年第一版发行，为强化学习的关键思想和算法提供了一个清晰而简单的描述，系统介绍了该领域的知识基础和历史到最近的发展和应用。该书被公认是一本经典教材，目前正在更新出版第二版，在网上有电子版可以参考。本课程以该书为主要教材，并展开介绍最新的强化学习算法和深度强化学算法。可作为人工智能学院研究生的专业基础课。

2022-04-13 14:12:15 28.06MB 国科大 强化学习

1

基于排序优先经验回放的竞争深度Q网络学习

为减少深度Q网络（DQN）算法的训练时间，采用结合优先经验回放机制与竞争网络结构的DQN方法，针对Open AI Gym平台cart pole和mountain car两个经典控制问题进行研究，其中经验回放采用基于排序的机制，而竞争结构中采用深度神经网络。仿真结果表明，相比于常规DQN算法、基于竞争网络结构的DQN方法和基于优先经验回放的DQN方法，该方法具有更好的学习性能，训练时间最少。同时，详细分析了算法参数对于学习性能的影响，为实际运用提供了有价值的参考。

2022-04-13 10:50:11 1.3MB 强化学习 深度Q网络 竞争网络

1

二维重心拉格朗日插值：在矩形上插值函数。-matlab开发

这是用于矩形上的乘积网格的重心拉格朗日插值的非常快速的矢量化二维扩展。有关如何使用脚本的演示，请参阅包含的文件。

2022-04-11 19:44:34 2KB matlab

1

Easy RL强化学习教程.rar

贡献者：Datawhale开源项目组作为人工智能里最受关注的领域之一，强化学习的热度一直居高不下，但它的学习难度也同样不低。在学习强化学习的过程中，遇到了有无数资料却难以入门的问题，于是发起了Datawhale强化学习项目，希望自学的同时帮助更多学习者轻松入门。

2022-04-11 14:10:40 157.6MB 机器学习 强化学习

强化学习小程序 SASAR

2022-04-11 14:10:38 2.94MB 小程序 强化学习

1

个人信息

热门下载

最新下载

其他资源