Python_深度学习实战:75个有关神经网络建模、强化学习与迁移学习的解决方案
2021-10-28 20:12:02 39.37MB 深度学习
文件夹内文件覆盖至安装目录。 无忧考吧专注于计算机等级模拟考试系统与财会考试模拟系统的开发与维护,拥有全面的教、学、模、练体系,其中包括会计从业、初级职称、计算机一级MS、二级MS、二级C语言、二级C++、二级JAVA、二级Access、二级VB、二级VF等多个模拟系统。
2021-10-28 19:57:31 308.44MB 强化学习
1
我把莫烦Q-learning“寻宝藏”小例子的代码给MATLAB化了,大家下载之后粘贴进MATLAB实时脚本就可直接运行。
2021-10-28 15:26:14 6KB Q学习 强化学习 莫烦 MATLAB
1
本资源适用于强化学习的入门使用,比较适合学生,原理讲解的比较清晰
2021-10-28 10:18:03 27.23MB Qlearn
1
使用Pytorch和多项式分布采样实现DDQN算法 DDQN和Nature DQN一样,也有一样的两个Q网络结构。在Nature DQN的基础上,通过解耦目标Q值动作的选择和目标Q值的计算这两步,来消除过度估计的问题。
2021-10-28 10:11:39 49KB Pytorch DDQN 深度强化学习
1
强化学习的发展历程 1956 Bellman提出了动态规划方法 1977 Werbos提出自适应动态规划方法 1988 Sutton提出了TD算法 1992 Watkins提出了Q学习算法 1994 Rummery等提出了SARSA学习算法 1996 Bertsekas等提出了解决随机过程优化控制的神经动态规划方法 1999 Thrun提出了部分可观测马尔科夫决策过程中的蒙特卡罗方法 2006 Kocsis等提出了置信上限树算法 2009 Lewis等提出了反馈控制自适应动态规划算法 2014 Silver等提出确定性策略梯度算法
2021-10-27 22:50:44 1001KB 强化学习 人工智能
1
国内发展现状 强化学习在国内处于发展阶段,并取得一定成绩。杨璐采用强化学习中的TD算法对经济领域的问题进行预测;蒋国飞将Q学习应用在倒立摆控制系统,并通过对连续空间的离散化,证明了在满足一定条件下的Q学习的收敛性;张健沛等对连续动作的强化学习方法进行了研究,并将其应用到机器人避障行为中……。
2021-10-27 22:48:10 1001KB 强化学习 人工智能
1
最近做毕业设计把资料共享一下吧-LQR系统最优控制器设计的MATLAB实现及应用.pdf 如题:开始发了20多篇但不知怎么提示不成功,先发小点试一下 作为回报,希望高手们能提供一下如下系统的控制策略 Transfer function:              -3e007 s^2 7.2e012 s - 5.76e017 ----------------------------------------------------------- s^4 2.403e005 s^3 1.926e010 s^2 4.92e012 s 7.58e015 做了好些试验都不理想,可以用PID和LQR
2021-10-27 03:23:47 336KB matlab
1
周博磊强化学习课程源码
2021-10-26 17:13:05 6.93MB 强化学习
1
作哈密顿函数 协态方程为 (5-60)
2021-10-25 20:38:32 2.02MB 最优控制
1