只为小站
首页
域名查询
文件下载
登录
首页
人工智能
深度学习
李升波-强化学习与控制-第七讲
李升波-强化学习与控制-第七讲
上传者:
ID_Lab_THU
|
上传时间: 2021-07-09 16:08:09
|
文件大小: 2.17MB
|
文件类型: PDF
强化学习
最优控制
李升波教授
策略梯度法
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的策略梯度法,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
文件下载
立即下载
评论信息
其他资源
matlab绘制B样条曲面代码
傅里叶变换轮廓术的MATLAB实现
基于JAVA语言开发失物招领系统的设计和实现
2048小游戏完整项目源码.zip
中国科技统计年鉴2011-2016
八斗学院大数据第九期
numpy-1.19.5-cp##-cp##-win_amd64.rar
vc会员积分管理(MFC数据库练手,开源,注释清晰
World Machine 2 Professional 2.3.7 64位汉化版(内附key)
学生信息管理系统(MySQL版)V1.0.rar
CanvasXjt.zip
roboserver:无需编写任何代码即可控制OpenComputers机器人!-源码
bootstrap做登录注册页面带验证
银行卡号识别Demo(windows程序)
spring swagger demo
SQL必知必会的样例
【VS2010 C# 代码】把文字做成图片
百度语音识别与语音合成官方demo
Struts2 实例 (登陆+增删改查+数据库文件+配置文件)
编译原理词法分析器实验(从文件读入)
AD-DC矩阵变换器及其应用研究
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
机器学习
深度学习
搜索引擎
计算广告
VR
热门下载
YOLOv5 人脸口罩图片数据集
IEEE33节点配电网Simulink模型.rar
基于ray filter的雷达点云地面过滤ROS节点
中国地面气象站观测数据2000-2021
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
Plex v7.12电视端app
基于matlab的车牌识别系统设计
2019综合测评仿真.zip
transformer_pytorch_inCV.rar
长江流域shp.zip
商用密码应用与安全性评估——霍炜.pdf
大学生网页设计大作业-5个网页设计制作作品自己任选
韦来生《数理统计》课后习题与答案
基于STM32的电子时钟设计
最新下载
开发环境:win10、Qt5.15.2 主要实现低功耗蓝牙BLE的基本功能:设备扫描、设备连接、发现服务、发现特征、特征及描述符
CWRU轴承数据集(附说明文件)
Qlearning的PPT
SEG-D Viewer
小智微直播平台V3.4.9全开源解密版.7z
STC单片机无线遥控解码程序
opc:Golang中的OPC DA客户端,用于基于Windows COM监视和分析过程数据-源码
IEC62368-1-2018音频视频、信息和通信设备 第1部分安全要求.pdf
mimikatz 2.1
MFC通过CEF封装Chrome浏览器内核