只为小站
首页
域名查询
文件下载
登录
强化学习入门必读书籍
本资源适用于强化学习的入门使用,比较适合学生,原理讲解的比较清晰
2021-10-28 10:18:03
27.23MB
Qlearn
1
Qlearn
ing的PPT
Qlearn
ing的PPT讲义,包括举例子以及公式推导。
QLearn
ing是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的 s 状态下(s∈S),采取 动作a (a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报reward r,所以算法的主要思想就是将State与Action构建成一张Q-table来存储Q值,然后根据Q值来选取能够获得最大的收益的动作。
2021-10-21 19:50:30
30.5MB
Qlearn
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于LSTM模型的股票预测模型_python
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
2019综合测评仿真.zip
CNN卷积神经网络Matlab实现
中国地面气候资料日值数据集(V3.0)2010-2019.rar
故障诊断数据集及实现代码
DirectX修复工具V4.1增强版
Spring相关的外文文献和翻译(毕设论文必备)
中国地面气候资料日值数据集(V3.0)-201001201912.rar
基于MQ2烟雾传感器的STM32F103程序
机械臂避障路径规划仿真 蚁群算法 三维路径规划
先进PID控制Matlab仿真第4版-PDF+代码.zip
鲸鱼优化算法 WOA matlab源代码(详细注释)
数字图像处理[冈萨雷斯]
最新下载
( 管家婆辉煌V7.2 绿色破解版(单机版)
F412V6_V6.0.2P2T1_UPGRADE_BOOTLDR.bin
《武汉市轨道交通12号线(江北段)工程环境影响报告书》.pdf
double_circle.slx
HamRadioDeluxe6.4.0.893安装特别版(附注册机破解教程)
开阳AMT630HV100 sdk开发相关资料
htscreen
Label Matrix v8.70破解文件
SPC控制图判异标准及异常处理方法
ORCAD_10.3_Licence生成程序.rar
其他资源
离散数学(第二版)最全课后习题答案详解
AD20官方中文教程.pdf
用户画像PPT介绍
wav生成波形图
Analytical Methods in Fuzzy Modeling and Control
AutoItX4Java
很实用的30个c#小程序实例
dev 13.1.8 破解 Devexpress 13.1.8 破解 Devexpress13.1.8 破解
intouch资料合集.pdf
opencv彩色三通道图片反色
java聊天小程序 基于C/S
myeclipse可视化图形界面插件+安装说明
华讯方舟AirMobi Router BB1002瘦AP启动TTL日志
小学计算 v1.0.rar
如何编写轻量级CSS框架
PhotoModeler基于功能的视频08
京东购物网页端顶部栏代码.rar
VB6魔塔之拯救白娘子源码.rar_魔塔吧
MONGOdb视频教程地址.txt
NV3D破解文件
最新2018年7月WebLogic漏洞(CVE-2018-2893) 适用于weblogic12.2.1.3
小m序列的源代码小m序列的源代码小m序列的源代码
计算机算法答案(computer algorithms introduction to design and analysis)
J1939协议栈(包括源码和标准)
MTCNN_face_detection_alignment.zip