只为小站
首页
域名查询
文件下载
登录
强化学习入门必读书籍
本资源适用于强化学习的入门使用,比较适合学生,原理讲解的比较清晰
2021-10-28 10:18:03
27.23MB
Qlearn
1
Qlearn
ing的PPT
Qlearn
ing的PPT讲义,包括举例子以及公式推导。
QLearn
ing是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的 s 状态下(s∈S),采取 动作a (a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报reward r,所以算法的主要思想就是将State与Action构建成一张Q-table来存储Q值,然后根据Q值来选取能够获得最大的收益的动作。
2021-10-21 19:50:30
30.5MB
Qlearn
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
长江流域shp.zip
基于Matlab的IEEE14节点潮流计算.zip
copula程序及算法.zip
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
商用密码应用与安全性评估——霍炜.pdf
离散时间信号处理第三版课后习题答案
西安问题电缆-工程伦理案例分析.zip
IBM CPLEX 12.10 学术版 mac操作系统安装包
YOLOv5 人脸口罩图片数据集
现代操作系统原理与实现.pdf
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
数据结构课后习题答案
神经·模糊·预测控制及其MATLAB实现PDF + MATLAB程序
opcua服务器模拟器+opcua客户端工具.rar
基于MQ2烟雾传感器的STM32F103程序
最新下载
华为HN8145XR升级文件 HN8145XR-V5R021C00S260
【FPGA】【Verilog】【AX301】四则小计算器设计
MLDN李兴华JavaWeb开发实战经典(高级案例篇)全部源码
健身跑步小程序源码
VHDL6位数字密码锁
计算机图形学大作业简易绘图板mfc
配网绝缘子缺陷检测数据集(1w多张,含txt标签)
FPGA 6位密码锁代码
北京交通大学随机过程历年试题
OCJP(1z0-808)试题答案详解.pdf
其他资源
winpck编辑器
基于UIC513标准的乘坐舒适度算法MATLAB代码
客户消费积分管理系统源代码
最新版瑞美检验注册机瑞美4.91注册码注册机下载
用KNN算法诊断乳腺癌
PPT宏摇号器
TP3+layui+Boots开发的币交易所后台+前台
数学建模30种基本模型分析
医院管理系统
W.P.S.10314.12012.2019.exe
elastic6.3.2pdf文档
频率选择性信道中的多用户分布式波束形成技术
工厂供配电设计开题报告.doc
android dbus应用
libevent 中文文档.doc
UcSTAR_setup_宝钢集团.exe
平面框架内力计算
Android7.0相机相册闪退处理,向下兼容
poster 壁报 模板 PPT 国际会议
TortoiseGit 中文破解版+教程
Zebra打印指令集文档
特征提取之滑动窗口
基于IC卡的网吧管理系统的实现