搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

WinRAR.exe 64位批处理必不可少的文件

WinRAR.exe 64位批处理必不可少的文件之一，有一些电脑上本来就带有WinRAR.exe（在C:\Program Files\WinRAR\WinRAR.exe）；对批处理感兴趣的小伙伴，可在我发布的文章中学习或相互交流一下！！！

2022-04-18 11:01:00 3.44MB 强化学习 批处理

1

Reinforcement Learning A Survey

Reinforcement Learning A Survey This paper surveys the eld of reinforcement learning from a computer-science perspective. It is written to be accessible to researchers familiar with machine learning. Both the historical basis of the eld and a broad selection of current work are summarized. Reinforcement learning is the problem faced by an agent that learns behavior through trial-and-error interactions with a dynamic environment. The work described here has a resemblance to work in psychology,

2022-04-17 12:05:54 444KB 强化学习

一个使用查表Q学习方法进行强化学习的简单示例

一个使用查表Q学习方法进行强化学习的简单示例。一个特工“o”在一维世界的左边，宝藏在最右边。运行这个程序，看看代理如何改进其寻找宝藏的策略。

2022-04-17 12:05:50 3KB 使用查表Q学习方法进行强化学习

基于python的强化学习算法Q-learning设计与实现

2022-04-17 12:05:50 6KB python 算法 开发语言

基于Jupyter Notebook与python的深度强化学习算法Deep Q Learning

2022-04-17 09:07:37 20KB python jupyter 算法 深度学习

基于Jupyter Notebook与python的深度强化学习算法Double DQN Solution

2022-04-17 09:07:36 21KB python jupyter 算法 开发语言

基于python的深度强化学习算法Deep Q Learning实现

2022-04-17 09:07:36 16KB python 算法 深度学习 开发语言

强化学习中文讲义。随着DeepMind公司开发的AlphaGo升级版master战胜围棋世界冠军，其背后应用的强化学习思想受到了

随着DeepMind公司开发的AlphaGo升级版master战胜围棋世界冠军，其背后应用的强化学习思想受到了广泛关注，也吸引了我想一探究竟为什么强化学习的威力这么大。早在2015年，DeepMind就在youtube上发布了围棋程序master的主要作者David Silver主讲的一套强化学习视频公开课，较为系统、全面地介绍了强化学习的各种思想、实现算法。其一套公开课一共分为十讲，每讲平均为100分钟。其中既包括扎实的理论推导，也有很多有趣的小例子帮助理解，对于理解强化学习来说是一套非常好的教程。我在跟随这套教程学习的过程中一边听讲、一边笔记，最后编写代码实践，终于算是对强化学习的概念终于有了初步的认识，算是入门了吧。为了巩固加深自己的理解，同时也能为后来的学习者提供一些较为系统的中文学习资料，我萌生了把整个公开课系统整理出来的想法。

2022-04-16 14:07:47 2.4MB 算法学习 深度学习 强化学习

1

图学习与强化学习如何结合是个重要的问题，来自东北大学的学者最近发布了《图强化学习》综述，总结了GRL方法的方法描述、开源代码和基

图学习与强化学习如何结合是个重要的问题，来自东北大学的学者最近发布了《图强化学习》综述，总结了GRL方法的方法描述、开源代码和基准数据集，非常值得关注！图挖掘任务产生于许多不同的应用领域，包括社交网络、交通运输、电子商务等，近年来受到了理论和算法设计界的极大关注。在图数据挖掘任务中，使用正在研究中的强化学习(RL)技术进行了一些开创性的工作。然而，这些图挖掘算法和RL模型分散在不同的研究领域，难以对不同的算法进行比较。在本综述中，我们提供了RL模型和图挖掘的全面概述，并将这些算法推广到图强化学习(GRL)作为一个统一形式化。我们进一步讨论了GRL方法在各个领域的应用，并总结了GRL方法的方法描述、开源代码和基准数据集。最后，提出了未来可能需要解决的重要方向和挑战。这是对GRL文献进行全面考察的最新成果，为学者提供了一个全球视野，也为该领域以外的学者提供了学习资源。此外，我们为想要进入这个快速发展的领域的感兴趣的学者和想要比较GRL方法的专家创建了一个在线开源软件。

2022-04-16 09:07:40 1.08MB 数据挖掘 算法学习网络

1

从监督学习到强化学习-四种深度学习方式原理知多少深度学习原理.doc

2022-04-15 13:17:32 20KB 学习 深度学习 人工智能

个人信息

热门下载

最新下载

其他资源