搜索【TRPO】的结果

TRPO-TensorFlow:纯TensorFlow中的信任区域策略优化（TRPO）

TRPO-张量流纯TensorFlow中的信任区域策略优化（TRPO）

2023-03-21 22:33:41 13KB reinforcement-learning tensorflow policy-gradient trpo

1

mujoco-pg:Mujoco环境下Vanilla PG，TNPG，TRPO，PPO的PyTorch实现

pytorch-trpo PyTorch实施香草政策梯度，截断的自然政策梯度，信任区政策优化，近端政策优化火车算法：PG，NPG，TRPO，PPO env ：Ant-v2，HalfCheetah-v2，Hopper-v2，Humanoid-v2，HumanoidStandup-v2，InvertedPendulum-v2，Reacher-v2，Swimmer-v2，Walker2d-v2 python train.py --algorithm "algorithm name" --env "environment name" 参考此代码是代码的修改版本

2022-08-10 18:13:52 10KB Python

1

强化学习算法汇总.rar

代码中包含13种强化学习算法，所调用的环境不仅包含gym下面的一些简单环境，还可以自己设计环境（简单的迷宫游戏），简洁明了，适合算法学习的同学使用，其中A3C与PPO还涉及了并行运算的算法。

2022-03-30 18:59:56 3.23MB DQN PPO DDPG TRPO

1

TRPO、PPO解读.docx

内含原文（.pdf）加中文详细解读解读（.doc），主要是对openai与deepmind的算法，进行完全解读（中文版），简单易懂

2022-01-15 23:58:08 350KB TRPO PPO

1

torchrl：强化学习算法的Pytorch实现（软演员评论员（SAC）DDPG TD3 DQN A2C PPO TRPO）-源码

火炬RL RL方法的Pytorch实现支持具有连续和离散动作空间的环境。支持具有1d和3d观察空间的环境。支持多进程环境要求一般要求火炬1.7 健身房（0.10.9） Mujoco（1.50.1）列表（用于日志） tensorboardX（日志文件输出）张量板要求 Tensorflow：启动tensorboard或读取tf记录中的日志安装使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求用法在配置文件中指定算法的参数，并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息目前包含：政策上的方法：加强 A2C（演员评论家） PPO（近端政策优化）

2021-11-23 11:43:20 170KB algorithm reinforcement-learning pytorch dqn

1

强化学习算法：此存储库包含大多数基于pytorch实现的经典深度强化学习算法，包括-DQN，DDQN，Dualling Network，DDPG，SAC，A2C，PPO，TRPO。（更多算法仍在进行中）-源码

深度强化学习算法该存储库将使用PyTorch实现经典的深度强化学习算法。该存储库的目的是为人们提供清晰的代码，以供他们学习深度强化学习算法。将来，将添加更多算法，并且还将保留现有代码。当前实施深度Q学习网络（DQN）基本DQN 双Q网络决斗网络架构深度确定性策略梯度（DDPG）优势演员评判（A2C）信任区域策略梯度（TRPO）近端政策优化（PPO）使用克罗内克因素信任区域（ACKTR）的演员评论家软演员评论（SAC）更新信息 :triangular_flag: 2018年10月17日-在此更新中，大多数算法已得到改进，并添加了更多关于图的实验（DPPG除外）。 PPO现在支持atari游戏和mujoco-env 。 TRPO非常稳定，可以得到更好的结果！ :triangular_flag: 2019-07-15-在此更新中，不再需要为openai基准安装。我在rl__utils模块中集成了有用的功能。 DDPG也重新实现，并支持更多结果。自述文件已被修改。代码结构也有微小的调整。 :triangular_flag: 201

2021-08-29 18:54:48 3.92MB algorithm deep-learning atari2600 flappy-bird

1

带有火炬的深度增强学习：DQN，AC，ACER，A2C，A3C，PG，DDPG，TRPO，PPO，SAC，TD3和PyTorch实施...-源码

状态：活动（在活动开发中，可能会发生重大更改）该存储库将实现经典且最新的深度强化学习算法。该存储库的目的是为人们提供清晰的pytorch代码，以供他们学习深度强化学习算法。将来，将添加更多最先进的算法，并且还将保留现有代码。要求 python <= 3.6 张量板体育馆> = 0.10 火炬> = 0.4 请注意，tensorflow不支持python3.7 安装 pip install -r requirements.txt 如果失败：安装健身房 pip install gym 安装pytorch please go to official webisite to install it: https://pytorch.org/ Recommend use Anaconda Virtual Environment to manage your packages 安装tensorboardX pip install tensorboardX pip install tensorflow==1.12 测试 cd Char10\ TD3/ python TD3

2021-06-09 21:34:59 5.82MB algorithm deep-learning deep-reinforcement-learning pytorch

1

个人信息

热门下载

最新下载

其他资源