WinRAR.exe 64位 批处理必不可少的文件之一,有一些电脑上本来就带有WinRAR.exe(在C:\Program Files\WinRAR\WinRAR.exe);对批处理感兴趣的小伙伴,可在我发布的文章中学习或相互交流一下!!!
2022-04-18 11:01:00 3.44MB 强化学习 批处理
1
Reinforcement Learning A Survey This paper surveys the eld of reinforcement learning from a computer-science perspective. It is written to be accessible to researchers familiar with machine learning. Both the historical basis of the eld and a broad selection of current work are summarized. Reinforcement learning is the problem faced by an agent that learns behavior through trial-and-error interactions with a dynamic environment. The work described here has a resemblance to work in psychology,
2022-04-17 12:05:54 444KB 强化学习
一个使用查表Q学习方法进行强化学习的简单示例。 一个特工“o”在一维世界的左边,宝藏在最右边。 运行这个程序,看看代理如何改进其寻找宝藏的策略。
基于python的强化学习算法Q-learning设计与实现
2022-04-17 12:05:50 6KB python 算法 开发语言
基于Jupyter Notebook与python的深度强化学习算法Deep Q Learning
2022-04-17 09:07:37 20KB python jupyter 算法 深度学习
基于Jupyter Notebook与python的深度强化学习算法Double DQN Solution
2022-04-17 09:07:36 21KB python jupyter 算法 开发语言
基于python的深度强化学习算法Deep Q Learning实现
2022-04-17 09:07:36 16KB python 算法 深度学习 开发语言
随着DeepMind公司开发的AlphaGo升级版master战胜围棋世界冠军,其背后应用的强化学习思想受到了广泛关注,也吸引了我想一探究竟为什么强化学习的威力这么大。早在2015年,DeepMind就在youtube上发布了围棋程序master的主要作者David Silver主讲的一套强化学习视频公开课,较为系统、全面地介绍了强化学习的各种思想、实现算法。其一套公开课一共分为十讲,每讲平均为100分钟。其中既包括扎实的理论推导,也有很多有趣的小例子帮助理解,对于理解强化学习来说是一套非常好的教程。我在跟随这套教程学习的过程中一边听讲、一边笔记,最后编写代码实践,终于算是对强化学习的概念终于有了初步的认识,算是入门了吧。为了巩固加深自己的理解,同时也能为后来的学习者提供一些较为系统的中文学习资料,我萌生了把整个公开课系统整理出来的想法。
2022-04-16 14:07:47 2.4MB 算法 学习 深度学习 强化学习
1
图学习与强化学习如何结合是个重要的问题,来自东北大学的学者最近发布了《图强化学习》综述,总结了GRL方法的方法描述、开源代码和基准数据集,非常值得关注!图挖掘任务产生于许多不同的应用领域,包括社交网络、交通运输、电子商务等,近年来受到了理论和算法设计界的极大关注。在图数据挖掘任务中,使用正在研究中的强化学习(RL)技术进行了一些开创性的工作。然而,这些图挖掘算法和RL模型分散在不同的研究领域,难以对不同的算法进行比较。在本综述中,我们提供了RL模型和图挖掘的全面概述,并将这些算法推广到图强化学习(GRL)作为一个统一形式化。我们进一步讨论了GRL方法在各个领域的应用,并总结了GRL方法的方法描述、开源代码和基准数据集。最后,提出了未来可能需要解决的重要方向和挑战。这是对GRL文献进行全面考察的最新成果,为学者提供了一个全球视野,也为该领域以外的学者提供了学习资源。此外,我们为想要进入这个快速发展的领域的感兴趣的学者和想要比较GRL方法的专家创建了一个在线开源软件。
2022-04-16 09:07:40 1.08MB 数据挖掘 算法 学习 网络
1
从监督学习到强化学习-四种深度学习方式原理知多少 深度学习原理.doc
2022-04-15 13:17:32 20KB 学习 深度学习 人工智能