只为小站
首页
域名查询
文件下载
登录
李升波-强化学习与控制-第六讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第六讲,主要介绍
间接型RL
的函数近似方法,包括常用近似函数,值函数近似,策略函数近似以及所衍生的Actor-critic架构等。
2021-07-09 16:08:09
2.31MB
强化学习
最优控制
李升波教授
间接型RL
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
鲸鱼优化算法 WOA matlab源代码(详细注释)
MATLAB车牌识别系统
神经·模糊·预测控制及其MATLAB实现PDF + MATLAB程序
Vivado license 永久
Python+OpenCV实现行人检测(含配置说明)
知网情感词典(HOWNET)
基于STM32的FFT频谱分析+波形识别
Android大作业——网上购物APP(一定是你想要的)
空间谱估计理论与算法------程序.rar
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
JPEG的Matlab实现
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
多机器人编队及避障仿真算法.zip
MAC OS.X.10.8.iso 镜像文件
基于YOLOV5的车牌定位和识别源码.zip
最新下载
基于Android无障碍服务实现的自动连点器
PcanView(汉化版)
FreeNAS-9.2.1.7-RELEASE-x64.iso
Differential Privacy From Theory to Practice.pdf
师学宝视频自动学习软件
kzllyy template20181214.zip
UT音效包完整版.7z
QYT8900车台说明书
Pointers On C
极域课堂管理系统软件v6.0-2.7.17466 2023专业版
其他资源
中景园电子OLE显示屏专用取模工具_PCtoLCD2002.rar
前端面试题全套整理附详细解答.pdf
计算离散随机变量的熵、联合熵、条件熵、互信息的Matlab程序与项目分析
web移动端真机调试工具
DenseNet AttentionUnet模型训练测试完整项目代码
Unity在线地图插件
黑马_Linux网络编程-网络基础-socket编程-高并发服务器
Python Deep Learning, 2nd Edition
QPSK蒙特卡罗仿真误码率计算
SSM+Maven电费管理系统源码+文档
中央广播电视大学《机械制造基础(专)》期末总复习资料(含答案).pdf
连接orcale数据库自动生成所需表映射类和mapper文。mybatis-generator.zip
运营常用网址.txt
2dn Courier New.rar
blog.minchin.ca:位于blog.minchin.ca的鹈鹕博客的来源-源码
大数据基础-Linux基础详解课程34.基本命令-date命令.mp4
MaterialDateTimePicker:在Android上以样式选择日期或时间-源码
Vigenere算法c语言的简单实现
littlevgl汉字生成工具,含测试代码
eMule源码VS2017实测通过
嵌入式学习资料--华清远见培训驱动源码
Unity导exe 去掉程序边框