只为小站
首页
域名查询
文件下载
登录
首页
人工智能
深度学习
李升波-强化学习与控制-第七讲
李升波-强化学习与控制-第七讲
上传者:
ID_Lab_THU
|
上传时间: 2021-07-09 16:08:09
|
文件大小: 2.17MB
|
文件类型: PDF
强化学习
最优控制
李升波教授
策略梯度法
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的策略梯度法,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
文件下载
立即下载
评论信息
其他资源
基于卷积神经网络的手写数字识别系统.rar
基于FPGA电子琴(verilog HDL)
emd和eemd算法的matlab源程序
ORACLE学生成绩信息管理系统.doc
食堂饭菜管理系统(带数据库)C#开发
自动控制原理ppt 独门资料十分详细
伺服电机应用技术.pdf,颜嘉男
在线招聘求职系统
vb控件自动移动到指定位置.txt
大量原理图元件.rar
美妆行业:花西子品牌拆解分析报告.pdf
java二维码生成及解析(内含QRCode所需jar包)
通信录管理系统(用数据库连接,包含实验报告)
gdb manual
Visual C++ MFC棋牌类游戏编程实例(五子棋,象棋,网络)
libssh2 1.8.0 32位动态库
MyKTV-点歌系统
Neitra 3d pro 基于多张2D图片的3D模型重建软件 基于多张2D图片的3D模型重建软件
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
机器学习
深度学习
搜索引擎
计算广告
VR
热门下载
计算机专业实习日记+实习周记+实习总结
得到品控手册7.0.pdf
华为OD机试真题.pdf
多智能体的编队控制程序的补充(之前上传少了一个文件)
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
voc车辆检测数据集(已处理好,可直接训练)
基于Matlab的IEEE14节点潮流计算.zip
大唐杯资料+题库(移动通信)
雷达信号处理仿真程序(MTI,MTD等)
java-spring-web-外文文献翻译40篇.zip
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
JPEG的Matlab实现
PSO-LSSVM的MATLAB代码.rar
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
最新下载
封装好的希尔伯特谱、边际谱、包络谱、瞬时频率/幅值/相位程序
英汉最全(包含Mdict和MdxExport两个工具以及最全词库)
ESXi-7.0U1sc-R_niu.iso_ESXi-7.0RTL8111RTL8125 操作系统.OS
SmartKit_V2R7C00RC9_zh.zip
解决win10禁止更新,windows update拒绝访问问题
jdk-17.0.8.zip(windows免安装版本)
LabVIEW-Modbus-API-master
MindMaster Linux 专业版(无水印)
c1700-k9w7-tar.zip
qqfarm资源包+flash插件.zip