A Novel DDPG Method with Prioritized Experience__Replay.rar
2021-04-08 21:02:40 17.39MB 强化学习 DDPG 经验回放
1
POMDP是增强学习的基础,很少见的讲解POMDP的讲义,详细并且清晰,是学习POMDP非常好的参考资料,深入浅出,值得拥有。
2021-04-08 10:37:22 2.18MB 马尔科夫决策过程 强化学习
1
四悬停点V1.0.txt
2021-04-08 09:15:29 4KB 强化学习 Q-Learning
1
提出了一种优化任何给定数学函数的新颖方法,称为“强化学习算法”(MORELA)。 尽管强化学习(RL)最初是为解决马尔可夫决策问题而开发的,但可以与某些改进一起使用以优化数学函数。 在MORELA的核心处,围绕在可行解决方案空间中找到的最佳解决方案生成一个子环境,并将其与原始环境进行比较。 因此,MORELA使得发现数学函数的全局最优成为可能,因为它是在前一个学习情节中使用子环境寻求的最佳解决方案的基础上寻求的。 已使用从文献中描述的其他优化方法获得的结果测试了MORELA的性能。 结果表明,就采用的鲁棒性衡量标准而言,MORELA可以提高RL的性能,并且比许多与之相比的优化方法表现更好。
2021-04-07 15:12:01 1.63MB 强化学习 数学功能 全局最优 子环境
1
近年来,深度强化学习的取得了飞速发展,为了提高深度强化学习处理高维状态空间或动态复杂环境的能力,研究者将记忆增强型神经网络引入到深度强化学习,并提出了不同的记忆增强型深度强化学习算法,记忆增强型深度强化学习已成为当前的研究热点.
2021-04-07 09:14:10 1.25MB 记忆增强 强化学习
1
一个纯手写的轮播图样例,适合新手学习研究轮播图的具体实现方式
2021-04-07 09:07:45 307KB javascript 强化学习 前端新手
1
TensorFlow深度学习该版本我做了详细笔记,也做了目录分类,希望能给大家帮助、一键三连哦!
2021-04-06 16:03:36 39.29MB 强化学习 机器学习 tensorflow 深度学习
1
包括基于动态规划的强化学习、基于蒙特卡洛的强化学习、基于时间差分的强化学习、Q-learning算法、sarsa算法
2021-04-04 09:11:58 2.04MB 强化学习 Q-learning sarsa 时间差分
1
北京林业大学-分析化学-考试试卷及答案
2021-04-03 09:04:04 268KB 强化学习
大学化学-课后习题答案(全)
2021-04-03 09:04:01 1.82MB 强化学习