搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

非线性阀门控制的强化学习：将 DDPG 应用于非线性阀门的“最佳”控制。可适用于其他模拟植物。-matlab开发

概括： * 此代码随附于题为“阀门控制的强化学习”的论文https://doi.org/10.1016/j.mlwa.2021.100030 * 该论文探讨了 RL 对非线性系统的优化控制* 平台：MATLAB 的强化学习工具箱（R2019a 版）和 Simulink * 运行 `main.m` 以执行测试运行以确保代码正常工作。它依次运行4个代码文件。它将训练一个只有 100 集的代理，将其存储在 `\results` 文件夹中，根据 PID 对其进行验证，执行稳定性分析（在现有的传递函数数据文件上，存储在 `\data` 文件夹中）并生成绘图和将它们存储在\ results文件夹中。 #### 训练 RL 控制器： * `code_DDPG_Training.m`：使用DDPG以分阶段方式训练代理的训练代码。使用 sm_DDPG_Training_Circuit.slx。该

2021-08-30 10:55:08 5.86MB matlab

1

matlabsimulink自动代码-simulink_python:使用simulink进行环境的模拟，使用python编写强化学习(rl)

matlab simulink自动代码 simulink_python 使用simulink进行环境的模拟，使用python编写强化学习代码快速开始项目简介 tcp通信模块测试 matlab与python之间使用tcp协议进行本地阻塞式通信，matlab接收python端信息后，才能使用simulink进行模拟（目前未解决模拟步长问题）。尝试将matlab和python分别作为客户端和服务端进行测试。其中，matlab作为客户端模拟100步时间为20s，python作为客户端模拟100步时间为2min。测试代码在。 rl模块测试使用的是经典的模型在调bug无果之后，准备先试试这个尝试项目项目缺少'svdutilitieslib' matlab，提示install 'Embedded Coder Support Package for ARM Cortex-A Processors，安装完之后发现无法打开matlab 将中文用户名修改为英文之后，问题解决，打开matlab之后发现所安装的模块没起作用，继续安装其他可能有用的模块在服务器是部署安装matlab 找到了两篇很好

2021-08-30 10:33:59 1.22MB 系统开源

1

基于DDPG强化学习算法的水下机器人姿态控制python代码.rar

DDPG强化学习算法, 姿态控制, python代码

2021-08-29 20:03:04 10KB DDPG 姿态控制 python代码

基于DQN深度强化学习算法的水下机器人姿态控制python代码.rar

DQN深度强化学习算法, 水下机器人姿态控制, python代码

2021-08-29 20:03:04 10KB DQN python代码 姿态控制

基于A2C深度强化学习算法的水下机器人姿态控制python代码.rar

A2C深度强化学习算法, 姿态控制, python代码

2021-08-29 20:03:03 10KB A2C深度强化学习 姿态控制 python代码

强化学习算法：此存储库包含大多数基于pytorch实现的经典深度强化学习算法，包括-DQN，DDQN，Dualling Network，DDPG，SAC，A2C，PPO，TRPO。（更多算法仍在进行中）-源码

深度强化学习算法该存储库将使用PyTorch实现经典的深度强化学习算法。该存储库的目的是为人们提供清晰的代码，以供他们学习深度强化学习算法。将来，将添加更多算法，并且还将保留现有代码。当前实施深度Q学习网络（DQN）基本DQN 双Q网络决斗网络架构深度确定性策略梯度（DDPG）优势演员评判（A2C）信任区域策略梯度（TRPO）近端政策优化（PPO）使用克罗内克因素信任区域（ACKTR）的演员评论家软演员评论（SAC）更新信息 :triangular_flag: 2018年10月17日-在此更新中，大多数算法已得到改进，并添加了更多关于图的实验（DPPG除外）。 PPO现在支持atari游戏和mujoco-env 。 TRPO非常稳定，可以得到更好的结果！ :triangular_flag: 2019-07-15-在此更新中，不再需要为openai基准安装。我在rl__utils模块中集成了有用的功能。 DDPG也重新实现，并支持更多结果。自述文件已被修改。代码结构也有微小的调整。 :triangular_flag: 201

2021-08-29 18:54:48 3.92MB algorithm deep-learning atari2600 flappy-bird

1

fxgl_jc_hjp_jy0201.doc

2021-08-29 13:08:02 2.09MB 强化学习

1

fxgl_jc_hjp_jy0301.doc

2021-08-29 13:08:02 2.76MB 强化学习

1

【python逆强化学习系列】学徒学习+gym仿真

【python逆强化学习系列】学徒学习+gym的MountainCar仿真（建议Linux环境运行），内涵requirments.txt环节配置文件，Human Expert制作单步仿真文件，训练曲线（png）和效果图（gif）。

2021-08-27 19:14:43 252KB python 逆强化学习 学徒学习 gym

1

马尔可夫决策过程实例讲解.pdf

中文版的MDP详细讲解，包括公式的完整推导过程，内容详细，通俗易懂，是学习MDP和强化学习难得的参考资料。

2021-08-26 16:45:05 1.68MB 马尔科夫决策过程 强化学习

1

个人信息

热门下载

最新下载

其他资源