揭秘深度强化学习-彭伟

上传者: hjl951314 | 上传时间: 2020-11-08 11:28:45 | 文件大小: 145.91MB | 文件类型: PDF
深度强化学习是深度学习算法和强化学习算法的巧妙结合, 它是一种新兴的通用人工智能算法技术, 也是机器学习的前沿技术, DRL算法潜力无限, AlphaGo是目前该算法最成功的使用案例。DRL算法以马尔科夫决策过程为基础, 是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划 (DP) 的算法以及基于策略优化的算法, 这本书共10章, 首先以AlphaGo在围棋大战的伟大事迹开始, 引起对人工智能发展和现状的介绍, 进而介绍深度强化学习的基本知识。然后分别介绍了强化学习 (重点介绍蒙特卡洛算法和时序差分算法) 和深度学习的基础知识、功能神经网络层、卷积神经网络 (CNN)、循环神经网络 (RNN), 以及深度强化学习的理论基础和当前主流的算法框架。最后介绍了深度强化学习在不同领域的几个应用实例。

文件下载

评论信息

  • roboit :
    丰富,有趣
    2020-02-14

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明