只为小站
首页
域名查询
文件下载
登录
第5课 强化学习中的
时间差分
第5课 强化学习中的
时间差分
2022-10-17 13:05:40
1.89MB
TemporalDiffere
强化学习
1
【jupyter notebook】强化学习中的
时间差分
算法实现笔记
【jupyter notebook】强化学习中的
时间差分
算法实现笔记
2022-10-17 13:05:33
1.24MB
TD
强化学习
时间差分
1
采用
时间差分
算法的九路围棋机器博弈系统 (2012年)
围棋机器博弈是机器博弈中重要的分支之一,其庞大的博弈空间给机器博弈研究者带来了巨大挑战.目前围棋机器博弈多采用静态估值搜索与蒙特卡洛树搜索,故将
时间差分
算法引入至九路围棋机器博弈系统中,提出基于
时间差分
算法的围棋机器博弈系统模型,该博弈系统具有一定的自学习能力,能在不断的对弈中逐步提高博弈能力.通过与采用α-β搜索算法的博弈系统进行实际对弈,证明了该方法的可行性.
2022-06-26 14:38:04
350KB
工程技术
论文
1
强化学习汇报.pptx
包括基于动态规划的强化学习、基于蒙特卡洛的强化学习、基于
时间差分
的强化学习、Q-learning算法、sarsa算法
2021-04-04 09:11:58
2.04MB
强化学习
Q-learning
sarsa
时间差分
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
数字图像处理[冈萨雷斯]
雷达信号处理仿真程序(MTI,MTD等)
EEupdate_5.35.12.0 win10下修改intel网卡mac
avantage 软件 xps 处理软件30天后不能使用问题
画程(版本6.0.0.127)setup个人版
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏
pytorch实现RNN实验.rar
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
Python+OpenCV实现行人检测(含配置说明)
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
Keil5安装包
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
最新下载
C语言版经纬度与高斯投影相互转换函数
彗星网页操作支持库2.0版(CometWebBrowser.fne)-易语言
FWFactoryTool5.50_2019127.rar
CSGO点赞举报机器人
泊车路径跟踪研究:垂直泊车纯跟踪算法与MPC-Carsim联合仿真方案(附文档分析、代码及环境设置),泊车路径跟踪研究:垂直泊车算法与MPC+Carsim联合仿真实战解析(matlab+Simulin
Qt调用FFmpeg库录屏并进行udp组播推流
MP4Writer.7z
基于mpc的自动泊车以及跟踪
aster v7 x6破解版
基于不同调制方式(16QAM、64QAM、QPSK)OFDM的MATLAB仿真(内附基本原理+程序)
其他资源
UA-DETRAC车辆检测数据集
python3 HTMLTestRunner截图&美化&优化
点扩散函数(PSF)
eclipse代码自动补全插件
基于ROS的移动机器人教程
SoMachine3.0 KEY
爱上processing
Pocket Controller-Professional.rar
Tomcat 8.0.rar
Python脚本项目源码-桌面宠物
nipho-todoz:简单的角度待办事项列表应用程序-源码
Basler pylon x86 4.0.0.3389
atom-inline-blame:Atom程序包显示blame inline-源码
kcontianer容器1.2版本
捕获全局异常UnException
SSH网上商城项目实战源码E_shop有jar包完整可运行
Android 动态壁纸 Live Wallpaper
进销存管理系统 毕业设计 库存管理系统 java jsp ssh
vue前端项目架构(vue)
索尼微单app
声纹识别MATLAB