搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

rocket-lander:火箭着陆器环境的强化学习

火箭着陆器OpenAI环境这是一款以SpaceX的Falcon 9第一阶段火箭为模型的垂直火箭着陆模拟器。该仿真是在Python 3.5中开发的，并且是使用编写。 Box2D是首选的物理引擎，其环境类似于。是正在运行的模拟器的视频。代码用于：比例积分控制（PID）深度确定性策略梯度（DDPG）现代预测控制（MPC）也可用，但不能一概而论。其他可用的示例代码：进化策略（ES）函数近似Q学习（FA Q学习）线性二次调节器（LQR）该项目的主要贡献是环境，其中包括用于控制器的其他脚本，以供上下文和一般参考。在environments存在用于仿真的代码。入门下载仓库。火箭着陆器可能是分叉的，并作为单独的包装提供，最终可以使用pip安装。先决条件运行项目所需的库列表：（某些库，例如cvxpy需要其他先决条件）。 Windows用户访问[Wi

2022-07-27 09:29:48 32MB Python

1

通过深度强化学习来模仿动作。-C/C++开发

SIGGRAPH 2018论文随附的介绍代码：“ DeepMimic：基于实例的角色导向的深度强化学习（基于物理的角色技能）”。该框架使用强化学习来训练模拟人形动物，以模仿SIGGRAPH 2018论文随附的变量介绍代码：“ DeepMimic：基于实例的角色技能指导深度强化学习”。该框架使用强化学习来训练模拟人形生物，以模仿来自运动捕捉数据的各种运动技能。项目页面：https://xbpeng.github.io/projects/DeepMimic/index.html依赖项sudo apt安装libgl1-mesa-dev libx11-dev libxrandr-dev libxi-dev sudo apt安装mesa-utils sudo apt安装clang sudo apt安装cmake C ++：

2022-07-26 19:15:01 369.39MB C/C++ Machine Learning

1

一类非线性动态系统基于强化学习的最优控制制

提出一类非线性不确定动态系统基于强化学习的最优控制方法. 该方法利用欧拉强化学习算法估计对象的未知非线性函数, 给出了强化学习中回报函数和策略函数迭代的在线学习规则. 通过采用向前欧拉差分迭代公式对学习过程中的时序误差进行离散化, 实现了对值函数的估计和控制策略的改进. 基于值函数的梯度值和时序误差指标值, 给出了该算法的步骤和误差估计定理. 小车爬山问题的仿真结果表明了所提出方法的有效性.

2022-07-20 16:57:02 189KB 非线性动态系统|强化学习|最优控制|值函数|策略函数

1

Sutton强化学习经典教材及python代码

Sutton强化学习经典教材及python代码，全英文，适合对强化学习有兴趣的人使用

2022-07-20 15:28:11 17.68MB 强化学习 Sutton 代码

1

深度强化学习-高清英文版-带目录书签-Aske Plaat著-2022年2月出版.pdf

最新版强化学习教材，内容包括单智能体和多智能体。

2022-07-20 12:05:11 21.45MB 深度强化学习 人工智能 机器学习 计算机科学

1

【翻译原创】对on-policy deep actor-critic算法有影响的参数

2022-07-16 09:07:06 1.57MB 强化学习 算法 python 经验分享

1

pid控制器设计代码matlab-awesome-papers:有关深度学习，强化学习，GAN的最新论文清单

pid控制器设计代码matlab 真棒纸有关深度学习，强化学习，GAN和Quadrotor控制理论的最新论文清单。最新的：深度学习： 2017年。 Jakob N.Foerster等al。牛津大学，加州大学伯克利分校，CMU的OpenAI。。盖·卡兹（Guy Katz）等。 al。斯坦福大学。。 Priya Goyal等。 Facebook。。陈畅友等。布法罗大学，杜克大学。。让·皮埃尔·布赖特（Jean-Pierre Briot）等。巴黎高中。索尼等。刘伟义等。中国电子科技大学，IBM沃森研究中心，哥伦比亚大学，波士顿大学。大卫·雅各布斯（David Jacobs）。马里兰大学-马里兰大学学院分校。。 UT奥斯汀。 Goodfellow等。 al。蒙特利尔大学。（2014）。 **苏吉思·拉维（Sujith Ravi）。 Google研究。 ** 。 Soumith。。 Vishwanath等。罗格斯。。九乡谷。南大，新加坡。。永成静微软，亚利桑那州立大学。。梁铮等。澳大利亚悉尼科技大学。。王枫代尔夫特。。 J

2022-07-15 15:15:56 19.18MB 系统开源

1

基于DSP的小波阈值去噪算法的实现

小波去噪是信号处理领域中的热点与前沿课题。阐述了小波去噪的基本原理和方法。利用TMS320F2812 DSP高速的运算能力、强大的实时处理能力等特点，在DSP上实现小波阈值去噪算法，为小波去噪提供了实时处理平台。采用软阁值函数和tein无偏风险阈值2t(rigrure规则)对噪声污染信号进行小波阈值去噪处理，实验发现，该法可以很好的去除噪声，满足信号去噪的光滑性和相似性准则。

2022-07-15 09:50:53 58KB 小波变换 阈值函数 信号去噪 Mallat算法

1

零基础安装学习教程，快速入门手册。

2022-07-15 09:06:54 123B 强化学习

1

Reinforcement Learning: An Introduction

Draft, Second edition, in progress. Richard S. Sutton and Andrew G. Barto

2022-07-14 18:34:50 8.76MB 强化学习 Sutton

1

个人信息

热门下载

最新下载

其他资源