搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

David解读深度强化学习.docx

David解读深度强化学习：从基础概念到AlphaGo

2021-08-17 09:13:51 3.27MB alphago

1

Policy Gradient系列算法.pptx

强化学习中policy gradient 类型的经典算法有PG，TRPO，PPO，DPPO

2021-08-17 09:13:44 536KB 强化学习

1

最优控制理论与应用

本书是工科院校自动控制类各研究方向的硕士研究生和高年级本科生的“最优控制”课程教材。基本内容有：变分法、连续系统最优控制、线性连续系统的二次型调节器(LQR)、离散系统最优控制、最大值原理、动态规划。为配合上述六个基本内容，列举了两个应用实例，即LQR在电力系统中的应用、最小值原理在登月软着陆中的应用。本书内容适合于40学时的教学。此外，本书还安排有最优控制的数值计算方法和奇异控制的内容，使读者对“最优控制”有完整的了解。本书用MATLAB完成数值计算，并使用MATLAB的Symbolic Math工具箱（特别是用符号数学工具箱求取TPBVP的解析解）、Control System工具箱和Simulink（特别是用它对Bang-Bang控制完成仿真）等。本书注重阐述思想和概念，演算明晰，力求流畅，以利阅读；部分章后附有课外阅读的参考文献、习题和上机安排。所以，本书不仅是硕士研究生和高年级本科生的教材，也可以作为自动控制技术人员的进修读物。

2021-08-16 19:41:36 55.35MB 最优控制

1

David Silver深度强化学习课程2020版课件

David Silver深度强化学习课程2020版课件，从David Silver个人网站直接的下载的

2021-08-16 16:53:35 14.79MB David Silver 深度强化学习

1

强化学习TD算法MATLAB程序

MALTAB例程，实现强化学习TD算法，为强化学习算法的学习者提供帮助

2021-08-16 11:26:30 2KB 强化学习

1

面向数据中心绿色可靠运行的强化学习方法

数据中心的绿色可靠运行具有重大的社会经济价值。综述了面向数据中心绿色可靠运行的优化与控制方法，提出一种事件驱动的强化学习方法，用于提升运行能效；提出一种电池寿命预测方法，提升了预测精度。

2021-08-15 14:02:36 5.39MB 数据中心 信息物理融合能源系统 强化学习 事件驱动的优化

1

平衡点：非线性动态系统的平衡点。-matlab开发

非线性动态系统的平衡点。 xdot = f(x,u) 的均衡搜索从 x = x0, u = u0 开始。

2021-08-15 08:48:27 2KB matlab

1

插值函数griddata格式为:-matlab插值法的讲解ppt

插值函数griddata格式为: cz =griddata（x，y，z，cx，cy，‘method’）用MATLAB作散点数据的插值计算要求cx取行向量，cy取为列向量。 ‘nearest’ 最邻近插值 ‘linear’ 双线性插值 ‘cubic’ 双三次插值 'v4'- Matlab提供的插值方法缺省时, 双线性插值被插值点插值方法插值节点被插值点的函数值

2021-08-14 14:34:58 464KB MATLAB 插值法

1

Python-PyTorch基于强化学习实践教程并提供清晰易读的代码

PyTorch基于强化学习实践教程：Deep Q Learning强化学习之旅

2021-08-13 22:42:54 708KB Python开发-机器学习

1

Time-domain Sinc Interpolation (Resampling)：时域SINC重采样（插值）函数用一个简单的例子-matlab开发

使用 SINC 内核对原始输入时间序列进行卷积以获得重采样时间序列的稳健插值函数。评论部分提供了一个简单的示例来说明 resampleSINC 的工作原理。另请参阅 resampleFDZP 以了解频域零填充 (FDZP) 重采样。

2021-08-13 19:54:56 21KB matlab

1

个人信息

热门下载

最新下载

其他资源