只为小站
首页
域名查询
文件下载
登录
首页
人工智能
深度学习
李升波-强化学习与控制-第七讲
李升波-强化学习与控制-第七讲
上传者:
ID_Lab_THU
|
上传时间: 2021-07-09 16:08:09
|
文件大小: 2.17MB
|
文件类型: PDF
强化学习
最优控制
李升波教授
策略梯度法
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的策略梯度法,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
文件下载
立即下载
评论信息
其他资源
Kodak 柯达i2400/2600/2800 高扫软件 smart touch
(超详细)Oracle11gR2 RAC在Windows Server 2008环境下的安装配置.pdf
飞思卡尔 舵机和电机的PID控制算法
Android开发的贪吃蛇(专门用于课程设计)
stm32+QMC5883L磁力传感器,可以用来融合校准MPU6050Z轴偏移
任意串口BootLoader程序升级
C++电话薄 文件读取 文件写入 添加删除修改联系人 分类显示 查询功能
环境风险预测软件 risksystem1.2.0.2
ptpd-2.3.2源码
Qt实现全局钩子拦截鼠标键盘消息修改消息
authorware期末作品
org.apache.poi JAR包
MFC银行管理系统
Oracle112040
2010年吉利熊猫评估报告.docx
matrix01.zip
IBM Information DataStage V11.5安装部署操作手册.docx
cmake-3.19.3-win64-x64.rar
plsql8连接工具
c++读取ini文件封装类
网速测试html源码
node.js项目实践:构建可扩展的web应用
a review of igbt models
mysql-connector-java-5.1.30-bin.jar
dos和bios开发讲解.pdf
devexpress Report demo asp.net
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
机器学习
深度学习
搜索引擎
计算广告
VR
热门下载
凯斯西储大学(CWRU)轴承数据集(含数据包+整理Python程序+使用说明)
DBSCAN算法Matlab实现
SSM外文文献和翻译(毕设论文精品).doc
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
校园网规划与设计(报告和pkt文件)
基于STM32的FFT频谱分析+波形识别
matpower5.0b1.zip
基于YOLOV5的车牌定位和识别源码.zip
得到品控手册7.0.pdf
基于hadoop商品推荐系统课程设计
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
商用密码应用与安全性评估——霍炜.pdf
Spring相关的外文文献和翻译(毕设论文必备)
基于VMD算法的信号降噪.rar
狂神说Java系列笔记.rar
最新下载
pdi-ce-9.0.0.0-423
DirectShow访问USB摄像头Demo
fast-lio2代码
最优化算法/工程优化 陈开周版课后习题1到4章答案
伽卡他电子教室杀手
应用非线性控制(完整版 程代展中文译本).pdf
DevXUnityUnpacker--unity解包反编译工具--unity开发比较强悍的工具
教育培训挂机辅助 中国检察教育培训网络学院学习辅助 v1014
Creating Solid APIs with Lua
现代数字信号处理及其应用习题解答(何子述)