matlab simulink自动代码 simulink_python 使用simulink进行环境的模拟,使用python编写强化学习代码 快速开始 项目简介 tcp通信模块测试 matlab与python之间使用tcp协议进行本地阻塞式通信,matlab接收python端信息后,才能使用simulink进行模拟(目前未解决模拟步长问题)。 尝试将matlab和python分别作为客户端和服务端进行测试。其中,matlab作为客户端模拟100步时间为20s,python作为客户端模拟100步时间为2min。测试代码在。 rl模块测试 使用的是经典的模型 在调bug无果之后,准备先试试这个 尝试项目 项目缺少'svdutilitieslib' matlab,提示install 'Embedded Coder Support Package for ARM Cortex-A Processors,安装完之后发现无法打开matlab 将中文用户名修改为英文之后,问题解决,打开matlab之后发现所安装的模块没起作用,继续安装其他可能有用的模块 在服务器是部署安装matlab 找到了两篇很好
2021-08-30 10:33:59 1.22MB 系统开源
1
DDPG强化学习算法, 姿态控制, python代码
2021-08-29 20:03:04 10KB DDPG 姿态控制 python代码
DQN深度强化学习算法, 水下机器人姿态控制, python代码
2021-08-29 20:03:04 10KB DQN python代码 姿态控制
A2C深度强化学习算法, 姿态控制, python代码
深度强化学习算法 该存储库将使用PyTorch实现经典的深度强化学习算法。 该存储库的目的是为人们提供清晰的代码,以供他们学习深度强化学习算法。 将来,将添加更多算法,并且还将保留现有代码。 当前实施 深度Q学习网络(DQN) 基本DQN 双Q网络 决斗网络架构 深度确定性策略梯度(DDPG) 优势演员评判(A2C) 信任区域策略梯度(TRPO) 近端政策优化(PPO) 使用克罗内克因素信任区域(ACKTR)的演员评论家 软演员评论(SAC) 更新信息 :triangular_flag: 2018年10月17日-在此更新中,大多数算法已得到改进,并添加了更多关于图的实验(DPPG除外)。 PPO现在支持atari游戏和mujoco-env 。 TRPO非常稳定,可以得到更好的结果! :triangular_flag: 2019-07-15-在此更新中,不再需要为openai基准安装。 我在rl__utils模块中集成了有用的功能。 DDPG也重新实现,并支持更多结果。 自述文件已被修改。 代码结构也有微小的调整。 :triangular_flag: 201
2021-08-29 18:54:48 3.92MB algorithm deep-learning atari2600 flappy-bird
1
fxgl_jc_hjp_jy0201.doc
2021-08-29 13:08:02 2.09MB 强化学习
1
fxgl_jc_hjp_jy0301.doc
2021-08-29 13:08:02 2.76MB 强化学习
1
【python逆强化学习系列】学徒学习+gym的MountainCar仿真(建议Linux环境运行),内涵requirments.txt环节配置文件,Human Expert制作单步仿真文件,训练曲线(png)和效果图(gif)。
2021-08-27 19:14:43 252KB python 逆强化学习 学徒学习 gym
1
中文版的MDP详细讲解,包括公式的完整推导过程,内容详细,通俗易懂,是学习MDP和强化学习难得的参考资料。
2021-08-26 16:45:05 1.68MB 马尔科夫决策过程 强化学习
1
相扑 SUMO-RL通过用于交通信号控制的提供了一个简单的界面来实例化强化学习环境。 主类继承了的 。 如果使用参数'single-agent = True'实例化,则其行为类似于来自的常规 。 负责使用 API检索信息并在交通信号灯上。 该存储库的目标: 提供一个简单的界面,以与使用SUMO的交通信号控制强化学习一起使用 支持Multiagent RL 与gym.Env和流行的RL库(例如和 易于定制:状态和奖励定义易于修改 安装 安装最新版本的SUMO: sudo add-apt-repository ppa:sumo/stable sudo apt-get update sudo apt-get install sumo sumo-tools sumo-doc 不要忘记设置SUMO_HOME变量(默认的sumo安装路径为/ usr / share / sumo) ec
2021-08-26 13:54:45 583KB reinforcement-learning gym sumo rl-algorithms
1