David解读深度强化学习:从基础概念到AlphaGo
2021-08-17 09:13:51 3.27MB alphago
1
强化学习中policy gradient 类型的经典算法有PG,TRPO,PPO,DPPO
2021-08-17 09:13:44 536KB 强化学习
1
本书是工科院校自动控制类各研究方向的硕士研究生和高年级本科生的“最优控制”课程教材。基本内容有:变分法、连续系统最优控制、线性连续系统的二次型调节器(LQR)、离散系统最优控制、最大值原理、动态规划。为配合上述六个基本内容,列举了两个应用实例,即LQR在电力系统中的应用、最小值原理在登月软着陆中的应用。本书内容适合于40学时的教学。 此外,本书还安排有最优控制的数值计算方法和奇异控制的内容,使读者对“最优控制”有完整的了解。 本书用MATLAB完成数值计算,并使用MATLAB的Symbolic Math工具箱(特别是用符号数学工具箱求取TPBVP的解析解)、Control System工具箱和Simulink(特别是用它对Bang-Bang控制完成仿真)等。 本书注重阐述思想和概念,演算明晰,力求流畅,以利阅读;部分章后附有课外阅读的参考文献、习题和上机安排。所以,本书不仅是硕士研究生和高年级本科生的教材,也可以作为自动控制技术人员的进修读物。
2021-08-16 19:41:36 55.35MB 最优控制
1
David Silver深度强化学习课程2020版课件,从David Silver个人网站直接的下载的
2021-08-16 16:53:35 14.79MB David Silver 深度强化学习
1
MALTAB例程,实现强化学习TD算法,为强化学习算法的学习者提供帮助
2021-08-16 11:26:30 2KB 强化学习
1
数据中心的绿色可靠运行具有重大的社会经济价值。综述了面向数据中心绿色可靠运行的优化与控制方法,提出一种事件驱动的强化学习方法,用于提升运行能效;提出一种电池寿命预测方法,提升了预测精度。
1
非线性动态系统的平衡点。 xdot = f(x,u) 的均衡搜索从 x = x0, u = u0 开始。
2021-08-15 08:48:27 2KB matlab
1
值函数griddata格式为: cz =griddata(x,y,z,cx,cy,‘method’) 用MATLAB作散点数据的插值计算 要求cx取行向量,cy取为列向量。 ‘nearest’ 最邻近插值 ‘linear’ 双线性插值 ‘cubic’ 双三次插值 'v4'- Matlab提供的插值方法 缺省时, 双线性插值 被插值点 插值方法 插值节点 被插值点的函数值
2021-08-14 14:34:58 464KB MATLAB 插值法
1
PyTorch基于强化学习实践教程:Deep Q Learning强化学习之旅
2021-08-13 22:42:54 708KB Python开发-机器学习
1
使用 SINC 内核对原始输入时间序列进行卷积以获得重采样时间序列的稳健插值函数。 评论部分提供了一个简单的示例来说明 resampleSINC 的工作原理。 另请参阅 resampleFDZP 以了解频域零填充 (FDZP) 重采样。
2021-08-13 19:54:56 21KB matlab
1