搜索【非线性动态系统|强化学习|最优控制|值函数|策略函数】的结果

matlabsimulink自动代码-simulink_python:使用simulink进行环境的模拟，使用python编写强化学习(rl)

matlab simulink自动代码 simulink_python 使用simulink进行环境的模拟，使用python编写强化学习代码快速开始项目简介 tcp通信模块测试 matlab与python之间使用tcp协议进行本地阻塞式通信，matlab接收python端信息后，才能使用simulink进行模拟（目前未解决模拟步长问题）。尝试将matlab和python分别作为客户端和服务端进行测试。其中，matlab作为客户端模拟100步时间为20s，python作为客户端模拟100步时间为2min。测试代码在。 rl模块测试使用的是经典的模型在调bug无果之后，准备先试试这个尝试项目项目缺少'svdutilitieslib' matlab，提示install 'Embedded Coder Support Package for ARM Cortex-A Processors，安装完之后发现无法打开matlab 将中文用户名修改为英文之后，问题解决，打开matlab之后发现所安装的模块没起作用，继续安装其他可能有用的模块在服务器是部署安装matlab 找到了两篇很好

2021-08-30 10:33:59 1.22MB 系统开源

1

基于DDPG强化学习算法的水下机器人姿态控制python代码.rar

DDPG强化学习算法, 姿态控制, python代码

2021-08-29 20:03:04 10KB DDPG 姿态控制 python代码

基于DQN深度强化学习算法的水下机器人姿态控制python代码.rar

DQN深度强化学习算法, 水下机器人姿态控制, python代码

2021-08-29 20:03:04 10KB DQN python代码 姿态控制

基于A2C深度强化学习算法的水下机器人姿态控制python代码.rar

A2C深度强化学习算法, 姿态控制, python代码

2021-08-29 20:03:03 10KB A2C深度强化学习 姿态控制 python代码

强化学习算法：此存储库包含大多数基于pytorch实现的经典深度强化学习算法，包括-DQN，DDQN，Dualling Network，DDPG，SAC，A2C，PPO，TRPO。（更多算法仍在进行中）-源码

深度强化学习算法该存储库将使用PyTorch实现经典的深度强化学习算法。该存储库的目的是为人们提供清晰的代码，以供他们学习深度强化学习算法。将来，将添加更多算法，并且还将保留现有代码。当前实施深度Q学习网络（DQN）基本DQN 双Q网络决斗网络架构深度确定性策略梯度（DDPG）优势演员评判（A2C）信任区域策略梯度（TRPO）近端政策优化（PPO）使用克罗内克因素信任区域（ACKTR）的演员评论家软演员评论（SAC）更新信息 :triangular_flag: 2018年10月17日-在此更新中，大多数算法已得到改进，并添加了更多关于图的实验（DPPG除外）。 PPO现在支持atari游戏和mujoco-env 。 TRPO非常稳定，可以得到更好的结果！ :triangular_flag: 2019-07-15-在此更新中，不再需要为openai基准安装。我在rl__utils模块中集成了有用的功能。 DDPG也重新实现，并支持更多结果。自述文件已被修改。代码结构也有微小的调整。 :triangular_flag: 201

2021-08-29 18:54:48 3.92MB algorithm deep-learning atari2600 flappy-bird

1

fxgl_jc_hjp_jy0201.doc

2021-08-29 13:08:02 2.09MB 强化学习

1

fxgl_jc_hjp_jy0301.doc

2021-08-29 13:08:02 2.76MB 强化学习

1

【python逆强化学习系列】学徒学习+gym仿真

【python逆强化学习系列】学徒学习+gym的MountainCar仿真（建议Linux环境运行），内涵requirments.txt环节配置文件，Human Expert制作单步仿真文件，训练曲线（png）和效果图（gif）。

2021-08-27 19:14:43 252KB python 逆强化学习 学徒学习 gym

1

马尔可夫决策过程实例讲解.pdf

中文版的MDP详细讲解，包括公式的完整推导过程，内容详细，通俗易懂，是学习MDP和强化学习难得的参考资料。

2021-08-26 16:45:05 1.68MB 马尔科夫决策过程 强化学习

1

sumo-rl:一个简单的界面，用于通过SUMO实例化强化学习环境，以进行交通信号控制。与OpenAI的Gym Env和RLlib的MultiAgentEnv兼容-源码

相扑 SUMO-RL通过用于交通信号控制的提供了一个简单的界面来实例化强化学习环境。主类继承了的。如果使用参数'single-agent = True'实例化，则其行为类似于来自的常规。负责使用 API检索信息并在交通信号灯上。该存储库的目标：提供一个简单的界面，以与使用SUMO的交通信号控制强化学习一起使用支持Multiagent RL 与gym.Env和流行的RL库（例如和易于定制：状态和奖励定义易于修改安装安装最新版本的SUMO： sudo add-apt-repository ppa:sumo/stable sudo apt-get update sudo apt-get install sumo sumo-tools sumo-doc 不要忘记设置SUMO_HOME变量（默认的sumo安装路径为/ usr / share / sumo） ec

2021-08-26 13:54:45 583KB reinforcement-learning gym sumo rl-algorithms

1

个人信息

热门下载

最新下载

其他资源