Leiden大学Aske Plaat教授《深度强化学习》 深度强化学习近年来备受关注。在自动驾驶、游戏、分子重组和机器人等各种活动中,他们都取得了令人印象深刻的成果。在所有这些领域,计算机程序已经学会了解决困难的问题。他们学会了飞行模型直升机和表演特技动作,如回旋和翻滚。在某些应用中,他们甚至比最优秀的人类还要优秀,比如Atari、Go、扑克和星际争霸。深度强化学习探索复杂环境的方式提醒我们,孩子们是如何学习的,通过开玩笑地尝试东西,获得反馈,然后再尝试。计算机似乎真的拥有人类学习的各个方面; 这是人工智能梦想的核心。教育工作者并没有忽视研究方面的成功,大学已经开始开设这方面的课程。这本书的目的是提供深度强化学习领域的全面概述。这本书是为人工智能的研究生写的,并为希望更好地理解深度强化学习方法和他们的挑战的研究人员和实践者。我们假设学生具备本科水平的计算机科学和人工智能知识;本书的编程语言是Python。我们描述了深度强化学习的基础、算法和应用。我们将介绍已建立的无模型和基于模型的方法,它们构成了该领域的基础。发展很快,我们还涵盖了一些高级主题: 深度多智能体强化学习、深度层次强化学习和深度元学习。
2022-01-12 19:11:54 23.12MB 深度学习 强化学习
田春伟,徐永,李作勇,左望萌,费伦和刘宏的Atent-guided CNN for图像降噪(ADNet)由神经网络(IF:5.535)于2020年发布( ),并由Pytorch实现。 这篇论文被推到了Nueral Networks的主页上。 此外,微信公众号还在和 。 本文是第一篇通过深度网络属性解决复杂背景图像降噪的论文。 抽象 深度卷积神经网络(CNN)在低级计算机视觉中引起了相当大的兴趣。 研究通常致力于通过非常深的CNN来提高性能。 但是,随着深度的增加,浅层对深层的影响会减弱。 受这一事实的启发,我们提出了一种注意力导向的去噪卷积神经网络(ADNet),主要包括稀疏块(SB),特征增强块(FEB),注意块(AB)和重构块(RB)图像降噪。 具体而言,SB通过使用膨胀的和普通的卷积来去除噪声,从而在性能和效率之间进行权衡。 FEB通过很长的路途整合了全球和局部特征信息,以增强去噪
1
强化学习经典英文入门书,强化学习鼻祖sutton大作,入门必读
2022-01-06 12:21:49 11.65MB 强化学习 sutton
1
GAM ⠀ ⠀ 使用结构化注意的图分类的PyTorch实现(KDD 2018)。 抽象的 图分类是许多不同领域中实际应用中的问题。 为了解决这个问题,通常会计算某些图统计信息(即图特征),以帮助区分不同类别的图。 在计算此类特征时,大多数现有方法都会处理整个图形。 例如,在基于图的方法中,处理整个图以获得不同图或子图的总数。 但是,在许多实际应用中,图可能会嘈杂,仅在图的某些区域内会出现区分模式。 在这项工作中,我们研究了基于注意力的图分类问题。 注意的使用使我们可以专注于图表中较小但内容丰富的部分,从而避免在其余图表中产生干扰。 我们提出了一种新颖的RNN模型,称为图注意力模型(GAM),该模型通过自适应选择一系列“信息”节点来仅处理图的一部分。 在多个现实世界数据集上的实验结果表明,即使我们的方法仅局限于部分图形,该方法在图分类中也可以与各种众所周知的方法竞争。 该存储库提供了G
1
正式版第二版,来自于内部分享。不是试用版。高清、能复制
2022-01-02 17:42:28 85.29MB 强化学习 机器学习
1
FlappyBirdRL 使用强化学习的Flappy Bird hack 您可以在此处查看游戏和算法的摘要! 自己运行代码 代码并解压缩 打开终端并导航到该文件夹 cd ~/Downloads/FlappyBirdRL-master 使用python启动一个简单的服务器 python -m SimpleHTTPServer 8000 更多细节。 在浏览器中,导航到本地服务器的地址(默认为 )。 故障排除 您启动服务器了吗? 如果您刚刚打开index.html页面,则控制台中可能有关于原始请求的错误。 右键单击屏幕上的任意位置,单击“检查”,然后查看控制台。 是否存在以下错误? 示例 Failed to load file:///Users/.../res/flappyAtlas/atlas.txt: Cross origin requests are only supported for protocol schemes: http, data, chrome, chrome-extension, https." :该页面试图从磁盘加载文件,但是大多数现代浏览器将其阻
1
Deep Reinforcement Learning深度强化学习Deep Reinforcement Learning, 2017
2021-12-30 14:55:59 3.41MB 深度强化学习
1
我们将深度Q-Learning成功背后的理念与持续的 动作域。我们提出了一种基于确定性模型的无模型算法 可以在连续动作空间上操作的策略梯度。使用 同样的学习算法,网络结构和超参数,我们的算法 稳健地解决20多个模拟物理任务,包括经典 如手推车摆动、灵巧操作、腿部运动等问题 还有开车。我们的算法能够找到性能具有竞争力的策略 与那些发现的规划算法完全访问的动态 域及其衍生物的。我们进一步证明,对于许多 任务算法可以“端到端”学习策略:直接从原始像素输入。
2021-12-29 13:02:26 668KB 深度学习 强化学习 机器人 运动控制
1
A practical guide to mastering reinforcement learning algorithms using Keras Key Features: Build projects across robotics, gaming, and finance fields, putting reinforcement learning (RL) into action; Get to grips with Keras and practice on real-world unstructured datasets; Uncover advanced deep learning algorithms such as Monte Carlo, Markov Decision, and Q-learning.
2021-12-26 15:48:39 17.95MB Keras 强化学习 RL Reinforcement
1
Unity ML-Agents工具包 ()() Unity Machine Learning Agents工具包(ML-Agents)是一个开放源代码项目,使游戏和模拟能够用作训练智能代理的环境。 我们提供最新算法的实现(基于PyTorch),使游戏开发人员和业余爱好者可以轻松地训练2D,3D和VR / AR游戏的智能代理。 研究人员还可以使用提供的易于使用的Python API通过强化学习,模仿学习,神经进化或任何其他方法来训练Agent。 这些训练有素的代理可以用于多种目的,包括控制NPC行为(在多种设置下,例如多代理和对抗),自动测试游戏版本并评估预发布的不同游戏设计决策。 ML-A
2021-12-24 20:03:00 147.25MB reinforcement-learning deep-learning unity unity3d
1