只为小站
首页
域名查询
文件下载
登录
ddpg
_algorithm:
ddpg
算法的实现-源码
ddpg
_algorithm:
ddpg
算法的实现
2021-12-30 12:43:43
1.23MB
Python
1
ddpg
源码
ddpg
源码
2021-12-24 11:01:46
2KB
ddpg源码
torchrl:强化学习算法的Pytorch实现(软演员评论员(SAC)
DDPG
TD3 DQN A2C PPO TRPO)-源码
火炬RL RL方法的Pytorch实现 支持具有连续和离散动作空间的环境。 支持具有1d和3d观察空间的环境。 支持多进程环境 要求 一般要求 火炬1.7 健身房(0.10.9) Mujoco(1.50.1) 列表(用于日志) tensorboardX(日志文件输出) 张量板要求 Tensorflow:启动tensorboard或读取tf记录中的日志 安装 使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求 用法 在配置文件中指定算法的参数,并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息 目前包含: 政策上的方法: 加强 A2C(演员评论家) PPO(近端政策优化)
2021-11-23 11:43:20
170KB
algorithm
reinforcement-learning
pytorch
dqn
1
Deep-learning-for-a-robot-arm:BSc毕业项目-
DDPG
算法,用于解决到达和跟踪线问题-源码
机器人手臂的深度学习 实现强化学习算法之一(
DDPG
深度确定性Ploicy梯度),以控制机械臂。 该项目的目标是从安装在机器人上,以电机命令在一个端对端方式的照相机来映射特征。 推介会: 有关该项目的演示文稿,可以在这里找到: 二手工具和技术: Python 2.7 TensorFlow 1.5.1 OpenCV Vrep RemoteAPI 皮塞里亚尔 任务: 在工作空间中到达对象: 环境文件: 算法实现: 遵循黑线: 环境文件: 算法实现:
2021-11-22 22:14:39
3.9MB
Python
1
RLContinuousActionSpace:在连续状态和动作空间中进行强化学习。
DDPG
-源码
RLContinuousActionSpace 在连续状态和动作空间中进行强化学习。
DDPG
:深度确定性策略梯度和A3C:异步Actor-Critic代理 注意:环境是随机填充的查找表和模拟物理模型的常量的任意组合。 1°
DDPG
: 基于带有深度强化学习的持续控制: : 和来自精彩博客。 这种方法结合了DDQN算法(体验重播和目标网络)的优势以及可输出连续动作的行为者批评结构。 该算法首先在健身房开放式平台的pendulum-v0游戏中进行了验证,然后应用于定制的Envonement EnvPlant.py,模拟了温度模型: OU.py:探索是通过Ornstein-Uhlenbeck过程完成的,它具有便利的均值回复特性。 Models.py:演员,评论家和目标网络的神经网络 演员模型 批评模型 main.py:配置,训练,测试,显示,存储,加载 ReplayBuffer.py
2021-11-19 17:06:34
1.9MB
Python
1
强化学习源码(DP, MC, TD, DQN, PG, AC, A3C,
DDPG
).zip
包括DP, MC, TD, TD-lambda, DQN, PG, AC, A3C,
DDPG
, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码
2021-10-14 16:17:05
32.58MB
强化学习
1
DeepRLPID-main.zip
DDPG
调节PID参数
2021-10-13 18:04:30
75KB
DDPG
1
5.
ddpg
.ipynb
关于
ddpg
的例子,适合初学者对深度强化学习
ddpg
的认识和了解
2021-09-19 20:51:55
43KB
ddpg
1
machin:专为PyTorch设计的强化学习库(框架),实现了DQN,
DDPG
,A2C,PPO,SAC,MA
DDPG
,A3C,APEX,IMPALA ..-源码
可读,可重用,可扩展 Machin是为pytorch设计的增强库。 支持的型号 任何事物,包括循环网络。 支持的算法 当前,Machin已实现以下算法,该列表仍在增长: 单代理算法: 多主体算法: 大规模并行算法: 增强功能: 支持的算法: 进化策略 基于模型的方法 特征 1.可读 与其他强化学习库(例如著名的 , 和。 Machin尝试仅提供RL算法的简单明了的实现。 Machin中的所有算法均以最小的抽象设计,并具有非常详细的文档以及各种有用的教程。 2.可重复使用 Machin采用与pytorch类似的方法,将算法和数据结构封装在自己的类中。 用户无需设置一系列data collectors , trainers , runners , samplers ...即可使用它们,只需导入即可。 模型上的唯一限制是它们的输入/输出格式,但是,这些限制很小,可以轻松地使算法适
2021-09-17 19:09:16
1.54MB
python
reinforcement-learning
deep-learning
gae
1
a2c-ppo-
ddpg
:强化学习算法a2c,ppo和
ddpg
的实现-源码
a2c-ppo-
ddpg
2021-09-10 13:33:08
80KB
Python
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2020年数学建模国赛C题论文
张正友相机标定Opencv实现(完整程序+棋盘图)实例源码
基于Matlab的PI/4 DQPSK的调制解调源代吗
DirectX修复工具V4.1增强版
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
Keil5安装包
大学生网页设计大作业-5个网页设计制作作品自己任选
中国地面气象站观测数据2000-2021
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
超大规模集成电路先进光刻理论与应用.pdf
2010年-2020中国地面气候资料数据集(V3.0)
房价预测的BP神经网络实现_python代码
狂神说全部笔记内容.zip
拾荒者扫描器.zip
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
最新下载
GP338PLUS 6.10.2 写频软件
Virtual Audio Cable 4.10 (去除 "trial" 声音 + 安装设置说明).zip
LPC210x_ISP 编程软件
jlink v8出厂固件,亲刷好用
STM32的FOC电机库例程
fptw64所有版本下载 Intel(R) Flash Programming Tool
win10回收站 此项目的属性未知和没有清空回收站选项解决方法
HEG批处理.zip
小草手把手教你LabVIEW仪器控制
gb28181 测试平台 QT写的客户端(只有注册部分) gb28181文档
其他资源
SMPTE 424M 标准
算法概要设计说明书范例
自由度整车模型
键盘模拟鼠标滚轮滚动
遗传算法解决车辆路径问题(VRP)
网上书城的完整需求分析报告
基于python实现的http接口自动化测试框架
Win32 API 教程第二版(简体中文)
微波工程基础-李宗谦,余京兆,高葆新.rar
stm32f429I核心板
C++实现简单Socket编程,多客户端登陆以及检测客户端状态
电子邮件安全ppt.ppt
新编日语教程3课后练习答案.pdf
A distributed middleware for self-configurable wireless sensor networks
DragonTravel:Minecraft-servermods“ Bukkit”和“ Spigot”的插件-源码
ZXing-2.1.zip
图像旋转 裁剪
C# TCP服务器客户端通讯源码
基于wifi的室内定位校应用
3389开启关闭-----批处理开启或者关闭3389端口
JSP+SQL水费管理系统