搜索【DDPG】的结果

ddpg_algorithm:ddpg算法的实现-源码

ddpg_algorithm:ddpg算法的实现

2021-12-30 12:43:43 1.23MB Python

1

ddpg源码

2021-12-24 11:01:46 2KB ddpg源码

torchrl：强化学习算法的Pytorch实现（软演员评论员（SAC）DDPG TD3 DQN A2C PPO TRPO）-源码

火炬RL RL方法的Pytorch实现支持具有连续和离散动作空间的环境。支持具有1d和3d观察空间的环境。支持多进程环境要求一般要求火炬1.7 健身房（0.10.9） Mujoco（1.50.1）列表（用于日志） tensorboardX（日志文件输出）张量板要求 Tensorflow：启动tensorboard或读取tf记录中的日志安装使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求用法在配置文件中指定算法的参数，并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息目前包含：政策上的方法：加强 A2C（演员评论家） PPO（近端政策优化）

2021-11-23 11:43:20 170KB algorithm reinforcement-learning pytorch dqn

1

Deep-learning-for-a-robot-arm:BSc毕业项目-DDPG算法，用于解决到达和跟踪线问题-源码

机器人手臂的深度学习实现强化学习算法之一（DDPG深度确定性Ploicy梯度），以控制机械臂。该项目的目标是从安装在机器人上，以电机命令在一个端对端方式的照相机来映射特征。推介会：有关该项目的演示文稿，可以在这里找到：二手工具和技术： Python 2.7 TensorFlow 1.5.1 OpenCV Vrep RemoteAPI 皮塞里亚尔任务：在工作空间中到达对象：环境文件：算法实现：遵循黑线：环境文件：算法实现：

2021-11-22 22:14:39 3.9MB Python

1

RLContinuousActionSpace:在连续状态和动作空间中进行强化学习。 DDPG-源码

RLContinuousActionSpace 在连续状态和动作空间中进行强化学习。 DDPG：深度确定性策略梯度和A3C：异步Actor-Critic代理注意：环境是随机填充的查找表和模拟物理模型的常量的任意组合。 1°DDPG：基于带有深度强化学习的持续控制：：和来自精彩博客。这种方法结合了DDQN算法（体验重播和目标网络）的优势以及可输出连续动作的行为者批评结构。该算法首先在健身房开放式平台的pendulum-v0游戏中进行了验证，然后应用于定制的Envonement EnvPlant.py，模拟了温度模型： OU.py：探索是通过Ornstein-Uhlenbeck过程完成的，它具有便利的均值回复特性。 Models.py：演员，评论家和目标网络的神经网络演员模型批评模型 main.py：配置，训练，测试，显示，存储，加载 ReplayBuffer.py

2021-11-19 17:06:34 1.9MB Python

1

强化学习源码（DP, MC, TD, DQN, PG, AC, A3C, DDPG）.zip

包括DP, MC, TD, TD-lambda, DQN, PG, AC, A3C, DDPG, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码

2021-10-14 16:17:05 32.58MB 强化学习

1

DeepRLPID-main.zip

DDPG调节PID参数

2021-10-13 18:04:30 75KB DDPG

1

5.ddpg.ipynb

关于ddpg的例子，适合初学者对深度强化学习ddpg的认识和了解

2021-09-19 20:51:55 43KB ddpg

1

machin:专为PyTorch设计的强化学习库（框架），实现了DQN，DDPG，A2C，PPO，SAC，MADDPG，A3C，APEX，IMPALA ..-源码

可读，可重用，可扩展 Machin是为pytorch设计的增强库。支持的型号任何事物，包括循环网络。支持的算法当前，Machin已实现以下算法，该列表仍在增长：单代理算法：多主体算法：大规模并行算法：增强功能：支持的算法：进化策略基于模型的方法特征 1.可读与其他强化学习库（例如著名的，和。 Machin尝试仅提供RL算法的简单明了的实现。 Machin中的所有算法均以最小的抽象设计，并具有非常详细的文档以及各种有用的教程。 2.可重复使用 Machin采用与pytorch类似的方法，将算法和数据结构封装在自己的类中。用户无需设置一系列data collectors ， trainers ， runners ， samplers ...即可使用它们，只需导入即可。模型上的唯一限制是它们的输入/输出格式，但是，这些限制很小，可以轻松地使算法适

2021-09-17 19:09:16 1.54MB python reinforcement-learning deep-learning gae

1

a2c-ppo-ddpg:强化学习算法a2c，ppo和ddpg的实现-源码

a2c-ppo-ddpg

2021-09-10 13:33:08 80KB Python

1

个人信息

热门下载

最新下载

其他资源