Sutton&Barto撰写的《强化学习:简介》 (第2版)包括本章练习。 该资料库存储了我在理解强化学习过程中对这些练习的尝试。 所有练习均在Rmarkdown中完成,并按章节分开。 章节: 1:简介 第一部分:表格求解方法 2:多臂匪 3:有限马尔可夫决策过程 4:动态编程 5:蒙特卡洛方法 6:时差学习 7:n步自举 8:使用表格方法进行计划和学习 第二部分:近似解法 9:基于策略的预测 10:基于策略的近似控制 11:近似的非策略方法 12:资格跟踪 13:政策梯度法 第三节:深入了解 14:心理学 15:神经科学 16:应用和案例研究 17:边疆
2023-01-15 12:51:20 2KB
1
cpp代码-vector容器的练习
2023-01-07 11:23:32 1KB 代码
1
Go语言基于Gin、Gorm、Vue 实现的在线练习系统源码.zip
2023-01-04 14:20:21 2.87MB go语言
【DDOS打字练习机】
2023-01-04 11:04:56 2.28MB DDos
1
微信小程序
2023-01-03 13:24:06 1.16MB 微信小程序 腾讯云开发
1
基础物理学巩固练习解答、答案邢秀文主编.pdf
2023-01-03 12:31:15 7.55MB
1
主要介绍实验步骤和内容都在我的文章当中,这个是对电路进行的仿真
2022-12-31 13:11:36 104KB 文档资料
1
CUDA_Practice 一些CUDA练习代码,达特茅斯课程COSC 189.03的作业。 矩阵运算:matrix_operations.cu A * B A * B * A ^ T f范数 n-body模拟:n-body * .cu Ax = b的迭代求解器(稀疏A); 以2D泊松问题为例。 红黑色高斯-赛德尔(delus-black Gauss-Seidel):iterative_linear_solver.cu 共轭梯度求解器:conjugate_gradient_solver.cu
2022-12-29 21:57:24 19KB Cuda
1
AE加C#开发实现ArcMap部分功能练习 AE二次开发实现代码
2022-12-27 19:04:05 422KB AE C# ArcMap 例子
1
C语言 小小计算器 期末作业 源码集合,为广大学子提供真实可用的源码参考 这份源码的要求已经分布在我的动态中,请在我的“主页”中搜索 ——【C语言】 “小小计算器”基本功能实现 或 复制以下链接:http://t.csdn.cn/01wHm 即可找到 由于各学校课程不同,作业具体实现要求可能会有所不同,这份源码的要求已经分布在我的动态中,有需要的同学可以自行取用
2022-12-27 18:16:11 684KB C语言 期末作业 练习 基础
1