概括: * 此代码随附于题为“阀门控制的强化学习”的论文https://doi.org/10.1016/j.mlwa.2021.100030 * 该论文探讨了 RL 对非线性系统的优化控制* 平台:MATLAB 的强化学习工具箱(R2019a 版)和 Simulink * 运行 `main.m` 以执行测试运行以确保代码正常工作。 它依次运行4个代码文件。 它将训练一个只有 100 集的代理,将其存储在 `\results` 文件夹中,根据 PID 对其进行验证,执行稳定性分析(在现有的传递函数数据文件上,存储在 `\data` 文件夹中)并生成绘图和将它们存储在\ results文件夹中。 #### 训练 RL 控制器: * `code_DDPG_Training.m`:使用DDPG以分阶段方式训练代理的训练代码。 使用 sm_DDPG_Training_Circuit.slx。 该
2021-08-30 10:55:08 5.86MB matlab
1
matlab simulink自动代码 simulink_python 使用simulink进行环境的模拟,使用python编写强化学习代码 快速开始 项目简介 tcp通信模块测试 matlab与python之间使用tcp协议进行本地阻塞式通信,matlab接收python端信息后,才能使用simulink进行模拟(目前未解决模拟步长问题)。 尝试将matlab和python分别作为客户端和服务端进行测试。其中,matlab作为客户端模拟100步时间为20s,python作为客户端模拟100步时间为2min。测试代码在。 rl模块测试 使用的是经典的模型 在调bug无果之后,准备先试试这个 尝试项目 项目缺少'svdutilitieslib' matlab,提示install 'Embedded Coder Support Package for ARM Cortex-A Processors,安装完之后发现无法打开matlab 将中文用户名修改为英文之后,问题解决,打开matlab之后发现所安装的模块没起作用,继续安装其他可能有用的模块 在服务器是部署安装matlab 找到了两篇很好
2021-08-30 10:33:59 1.22MB 系统开源
1
DDPG强化学习算法, 姿态控制, python代码
2021-08-29 20:03:04 10KB DDPG 姿态控制 python代码
DQN深度强化学习算法, 水下机器人姿态控制, python代码
2021-08-29 20:03:04 10KB DQN python代码 姿态控制
A2C深度强化学习算法, 姿态控制, python代码
深度强化学习算法 该存储库将使用PyTorch实现经典的深度强化学习算法。 该存储库的目的是为人们提供清晰的代码,以供他们学习深度强化学习算法。 将来,将添加更多算法,并且还将保留现有代码。 当前实施 深度Q学习网络(DQN) 基本DQN 双Q网络 决斗网络架构 深度确定性策略梯度(DDPG) 优势演员评判(A2C) 信任区域策略梯度(TRPO) 近端政策优化(PPO) 使用克罗内克因素信任区域(ACKTR)的演员评论家 软演员评论(SAC) 更新信息 :triangular_flag: 2018年10月17日-在此更新中,大多数算法已得到改进,并添加了更多关于图的实验(DPPG除外)。 PPO现在支持atari游戏和mujoco-env 。 TRPO非常稳定,可以得到更好的结果! :triangular_flag: 2019-07-15-在此更新中,不再需要为openai基准安装。 我在rl__utils模块中集成了有用的功能。 DDPG也重新实现,并支持更多结果。 自述文件已被修改。 代码结构也有微小的调整。 :triangular_flag: 201
2021-08-29 18:54:48 3.92MB algorithm deep-learning atari2600 flappy-bird
1
fxgl_jc_hjp_jy0201.doc
2021-08-29 13:08:02 2.09MB 强化学习
1
fxgl_jc_hjp_jy0301.doc
2021-08-29 13:08:02 2.76MB 强化学习
1
【python逆强化学习系列】学徒学习+gym的MountainCar仿真(建议Linux环境运行),内涵requirments.txt环节配置文件,Human Expert制作单步仿真文件,训练曲线(png)和效果图(gif)。
2021-08-27 19:14:43 252KB python 逆强化学习 学徒学习 gym
1
中文版的MDP详细讲解,包括公式的完整推导过程,内容详细,通俗易懂,是学习MDP和强化学习难得的参考资料。
2021-08-26 16:45:05 1.68MB 马尔科夫决策过程 强化学习
1