搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

【路径规划】基于强化学习Q-Learing实现栅格地图路径规划matlab源码.zip

2021-11-19 20:23:12 534KB 简介

1

nnsysid:NNSYSID 工具箱包含许多用于识别非线性动态系统的工具-matlab开发

基于神经网络的系统识别工具箱版本 2 NNSYSID 工具箱包含许多用于识别具有神经网络的非线性动态系统的工具。提供了几种基于多层感知器网络的非线性模型结构，还有许多用于模型验证和模型结构选择的功能。该工具箱需要 MATLAB 5.3 或更高版本。工具箱随附手册（约 110 页，pdf 格式）。更多信息可以在www.iau.dtu.dk/research/control/nnsysid.html

2021-11-19 17:26:42 710KB matlab

1

RLContinuousActionSpace:在连续状态和动作空间中进行强化学习。 DDPG-源码

RLContinuousActionSpace 在连续状态和动作空间中进行强化学习。 DDPG：深度确定性策略梯度和A3C：异步Actor-Critic代理注意：环境是随机填充的查找表和模拟物理模型的常量的任意组合。 1°DDPG：基于带有深度强化学习的持续控制：：和来自精彩博客。这种方法结合了DDQN算法（体验重播和目标网络）的优势以及可输出连续动作的行为者批评结构。该算法首先在健身房开放式平台的pendulum-v0游戏中进行了验证，然后应用于定制的Envonement EnvPlant.py，模拟了温度模型： OU.py：探索是通过Ornstein-Uhlenbeck过程完成的，它具有便利的均值回复特性。 Models.py：演员，评论家和目标网络的神经网络演员模型批评模型 main.py：配置，训练，测试，显示，存储，加载 ReplayBuffer.py

2021-11-19 17:06:34 1.9MB Python

1

强化学习原著

This introductory textbook on reinforcement learning is targeted toward engineers and scientists in artificial intelligence, operations research, neural networks, and control systems, and we hope it will also be of interest to psychologists and neuroscientists. 关于强化学习的一本原著，花钱在淘宝上买的。很值得一看的一本书~

2021-11-18 21:32:53 3.59MB Sutton Barto MIT Press

1

Reinforcement Learning 强化学习ppt

结合网上信息和莫烦视频做的一个分享，本想转化成博客但是一些动画我觉得还是必要的，有兴趣的可以一起交流

2021-11-18 09:31:22 29.43MB reinforcement learning Q-learning SARSA

1

基于磁流变减振器汽车半主动悬架的最优控制仿真 (2011年)

建立了二自由度1/4汽车半主动悬架模型，在线性最优化理论的基础上设计出磁流变减振器半主动悬架的最优控制器，并在MAILAB/SIMULINK环境下进行仿真，结果表明采用最优控制器的流变减振器半主动悬架有效地改善了汽车行驶平顺性和乘坐舒适性。

2021-11-18 00:13:08 284KB 自然科学 论文

1

reinforcement-learning-implementation:强化学习示例的实现和解释-源码

强化学习算法的实现强化学习实例在每个文件中，都有一个jupyter笔记本及其相应的python文件。笔记本中记录了所有中间过程和绘图的位置，而在python文件中则是可以直接运行的已编译过程。网格世界井字游戏 Muilti-Arm强盗二十一点悬崖漫步随机游走（n步TD法）动态迷宫 DynaMaze实施 DynaMaze扩展实现随机漫步（一般） 1000状态随机游走平铺编码平铺编码实现山地车策略功能近似服务器访问持续任务的概括贝尔德计数器示例非政策学习的普遍化 TD-Lambda 随机游走离线-Lambda 随机游走TD（\ lambda）山车Lambda Sarsa-Lambda 策略近似短走廊

2021-11-17 21:26:09 4.8MB JupyterNotebook

1

QlearningProject：基于强化学习的移动机器人导航-源码

QlearningProject MatLab仿真，用于基于Q学习的避障和非周期性例程。用于避障例程和移动机器人控制的Python代码。

2021-11-17 17:23:37 6.36MB python reinforcement-learning matlab q-learning

1

rlb-dp:展示广告中通过强化学习进行的实时出价-源码

展示广告中通过强化学习进行的实时出价这是实验代码的存储库，支持WSDM 2017中的“展示广告中的强化学习实时出价”一文。小型评估演示有关小规模评估的演示，请在脚本文件夹下运行： $ bash small-scale.sh 或在python文件夹下运行： $ python3 bid_ss.py 运行后，您可以在控制台中打印性能表，如下所示： setting objective auction impression click cost win-rate CPM eCPC ipinyou, camp=1458, algo=ss_mdp, N=1000, c0=0.03125 11 350000

2021-11-17 11:00:23 30.22MB Python

1

essentials of robust control

该书是美国杰出华人教授周克敏的专著，堪称是鲁棒控制领域的经典著作，书中既有易懂的理论推导，也结合了matlab/simulink 对一些例子进行了一些辅助设计。学习鲁棒控制与MATLAB的同学们一定不要错过。

2021-11-13 16:08:43 3.84MB robust control 鲁棒控制，最优控制，matlab/simulink

1

个人信息

热门下载

最新下载

其他资源