近年来,深度强化学习的取得了飞速发展,为了提高深度强化学习处理高维状态空间或动态复杂环境的能力,研究者将记忆增强型神经网络引入到深度强化学习,并提出了不同的记忆增强型深度强化学习算法,记忆增强型深度强化学习已成为当前的研究热点.
2021-04-07 09:14:10 1.25MB 记忆增强 强化学习
1
【兰德公司报告】通过机器学习获得空中优势—人工智能辅助任务规划的初步探索 Air Dominance Through Machine Learning:A Preliminary Exploration of Artificial Intelligence–Assisted Mission Planning
2021-03-24 22:03:57 13.67MB 人工智能 智能规划 深度强化学习
1
DRL_Navigation Udacity深度强化学习课程的第一个项目 ## Setup环境此项目是由Anaconda开发的,建议在使用它的同时进行相同的操作。 要创建新的conda环境,请运行以下conda create --name drlnd python = 3.6 出现提示时继续。 Conda应该安装所有必需的软件包。 激活环境:conda activate drlnd 使用以下命令安装正确版本的pytorch: conda install pytorch=0.4.0 -c pytorch 我们正在使用的环境仅在需要单独下载时才可用。 从下面的链接之一下载环境。 您只需要选择与您的操作系统匹配的环境: Linux: Mac OSX: Windows(32位): Windows(64位): 解压缩刚刚下载的环境,并将其包含的文件夹放置在与此存储库相同的目录中。
2021-03-04 08:54:05 157KB JupyterNotebook
1
深度强化学习在通信和网络中的应用:一项调查
2021-03-02 14:05:36 3.12MB 研究论文
1
深度强化学习系列论文,包括最基础的DQN,DQN模型改进,DQN算法改进,分层DRL,基于策略梯度的深度强化学习等等,论文基本源自顶会
2021-02-23 10:01:18 69.27MB 深度强化学习 DQN
1
深度强化学习是深度学习算法和强化学习算法的巧妙结合, 它是一种新兴的通用人工智能算法技术, 也是机器学习的前沿技术, DRL算法潜力无限, AlphaGo是目前该算法最成功的使用案例。DRL算法以马尔科夫决策过程为基础, 是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划 (DP) 的算法以及基于策略优化的算法, 这本书共10章, 首先以AlphaGo在围棋大战的伟大事迹开始, 引起对人工智能发展和现状的介绍, 进而介绍深度强化学习的基本知识。然后分别介绍了强化学习 (重点介绍蒙特卡洛算法和时序差分算法) 和深度学习的基础知识、功能神经网络层、卷积神经网络 (CNN)、循环神经网络 (RNN), 以及深度强化学习的理论基础和当前主流的算法框架。最后介绍了深度强化学习在不同领域的几个应用实例。
2020-11-08 11:28:45 145.91MB 深度强化学习
1
深度学习在强化学习方面的应用所产生的深度强化学习取得快速发展。如何解释深度强化学习优势产生的原因是理解技术的基本方法。
2020-01-03 11:18:24 3.25MB 深度学习 强化学习
1
基于Tensorflow实现的PPO算法,依赖库:tensorflow-1.4及以上,gym
2020-01-03 11:16:56 6KB 深度强化学习
1
《揭秘深度强化学习(彭伟)》高清中文版PDF(带目录与书签)
1