只为小站
首页
域名查询
文件下载
登录
基于多维状态动作的
DDPG
冲突解脱算法研究
本文利用 Gym 对仿真环境进行注册,对 OpenScope 进行功能性改造,引入 成都双流机场最新进近区域内的固定点数据,包括各个扇区参数、进离场航线数据、进 近区管辖范围数据等,设计了简单的进近区 ATC 管制环境。该环境包括独立的进场、离 场情景,充分考虑了各种复杂情况下的冲突。其次,针对不同空域的复杂程度设计了相 应的冲突场景,如航路上的交叉冲突以及对头冲突,进、离场时的对头冲突、超越冲突 等,构建完备的冲突集。为了降低模型的复杂度,假设航空器在转弯过程中不考虑最小 转弯半径的限制。最后,考虑到解脱动作的连续性以及智能体状态的复杂性,本文以保 障飞行安全为前提,对航空器解脱策略进行研究。通过构建的空中交通管制仿真环境实 现智能体之间的交互训练任务,设计了冲突解脱模型的奖励函数,采用深度强化学习中 经典算法
DDPG
进行解脱策略的学习。仿真实验结果表明该算法对于多种冲突环境均 能够搜索到较优的解脱策略,冲突解脱成功率达到 89% 以上,可以作为管制员进行冲 突解脱的参考方案之一。
2022-01-04 13:01:40
11.77MB
空中交通管制
冲突探测与解脱
深度强化学习
DDPG
ddpg
_algorithm:
ddpg
算法的实现-源码
ddpg
_algorithm:
ddpg
算法的实现
2021-12-30 12:43:43
1.23MB
Python
1
ddpg
源码
ddpg
源码
2021-12-24 11:01:46
2KB
ddpg源码
torchrl:强化学习算法的Pytorch实现(软演员评论员(SAC)
DDPG
TD3 DQN A2C PPO TRPO)-源码
火炬RL RL方法的Pytorch实现 支持具有连续和离散动作空间的环境。 支持具有1d和3d观察空间的环境。 支持多进程环境 要求 一般要求 火炬1.7 健身房(0.10.9) Mujoco(1.50.1) 列表(用于日志) tensorboardX(日志文件输出) 张量板要求 Tensorflow:启动tensorboard或读取tf记录中的日志 安装 使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求 用法 在配置文件中指定算法的参数,并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息 目前包含: 政策上的方法: 加强 A2C(演员评论家) PPO(近端政策优化)
2021-11-23 11:43:20
170KB
algorithm
reinforcement-learning
pytorch
dqn
1
Deep-learning-for-a-robot-arm:BSc毕业项目-
DDPG
算法,用于解决到达和跟踪线问题-源码
机器人手臂的深度学习 实现强化学习算法之一(
DDPG
深度确定性Ploicy梯度),以控制机械臂。 该项目的目标是从安装在机器人上,以电机命令在一个端对端方式的照相机来映射特征。 推介会: 有关该项目的演示文稿,可以在这里找到: 二手工具和技术: Python 2.7 TensorFlow 1.5.1 OpenCV Vrep RemoteAPI 皮塞里亚尔 任务: 在工作空间中到达对象: 环境文件: 算法实现: 遵循黑线: 环境文件: 算法实现:
2021-11-22 22:14:39
3.9MB
Python
1
RLContinuousActionSpace:在连续状态和动作空间中进行强化学习。
DDPG
-源码
RLContinuousActionSpace 在连续状态和动作空间中进行强化学习。
DDPG
:深度确定性策略梯度和A3C:异步Actor-Critic代理 注意:环境是随机填充的查找表和模拟物理模型的常量的任意组合。 1°
DDPG
: 基于带有深度强化学习的持续控制: : 和来自精彩博客。 这种方法结合了DDQN算法(体验重播和目标网络)的优势以及可输出连续动作的行为者批评结构。 该算法首先在健身房开放式平台的pendulum-v0游戏中进行了验证,然后应用于定制的Envonement EnvPlant.py,模拟了温度模型: OU.py:探索是通过Ornstein-Uhlenbeck过程完成的,它具有便利的均值回复特性。 Models.py:演员,评论家和目标网络的神经网络 演员模型 批评模型 main.py:配置,训练,测试,显示,存储,加载 ReplayBuffer.py
2021-11-19 17:06:34
1.9MB
Python
1
强化学习源码(DP, MC, TD, DQN, PG, AC, A3C,
DDPG
).zip
包括DP, MC, TD, TD-lambda, DQN, PG, AC, A3C,
DDPG
, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码
2021-10-14 16:17:05
32.58MB
强化学习
1
DeepRLPID-main.zip
DDPG
调节PID参数
2021-10-13 18:04:30
75KB
DDPG
1
5.
ddpg
.ipynb
关于
ddpg
的例子,适合初学者对深度强化学习
ddpg
的认识和了解
2021-09-19 20:51:55
43KB
ddpg
1
machin:专为PyTorch设计的强化学习库(框架),实现了DQN,
DDPG
,A2C,PPO,SAC,MA
DDPG
,A3C,APEX,IMPALA ..-源码
可读,可重用,可扩展 Machin是为pytorch设计的增强库。 支持的型号 任何事物,包括循环网络。 支持的算法 当前,Machin已实现以下算法,该列表仍在增长: 单代理算法: 多主体算法: 大规模并行算法: 增强功能: 支持的算法: 进化策略 基于模型的方法 特征 1.可读 与其他强化学习库(例如著名的 , 和。 Machin尝试仅提供RL算法的简单明了的实现。 Machin中的所有算法均以最小的抽象设计,并具有非常详细的文档以及各种有用的教程。 2.可重复使用 Machin采用与pytorch类似的方法,将算法和数据结构封装在自己的类中。 用户无需设置一系列data collectors , trainers , runners , samplers ...即可使用它们,只需导入即可。 模型上的唯一限制是它们的输入/输出格式,但是,这些限制很小,可以轻松地使算法适
2021-09-17 19:09:16
1.54MB
python
reinforcement-learning
deep-learning
gae
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
西门子逻辑控制设计开发_3部10层
芯片验证漫游指南以及源代码.zip
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
2021华为芯片研发岗位笔试题
基于Matlab的IEEE14节点潮流计算.zip
基于MATLAB的水果图像识别
Android大作业——网上购物APP(一定是你想要的)
韦来生《数理统计》课后习题与答案
多智能体的编队控制matlab程序(自己编写的,可以运行)
先进PID控制Matlab仿真第4版-PDF+代码.zip
JPEG的Matlab实现
智能微电网中利用粒子群算法实现多目标优化(有完整数据可运行).zip
科研伦理与学术规范 期末考试2 (40题).pdf
2020年数学建模B题(国二)论文.pdf
最新下载
psxfin ps模拟器 绿色 最好的
Android中应用程序获得系统签名权限(platform.x509.pem platform.pk8 signapk.jar)
掌讯 YT9218 20200408 升级系统包
联想B490 BIOS H9ET83WW
DirectX修复工具V4.1增强版
司创软发卡器.rar
GIS空间分析教学数据
Google Plugin for Eclipse 4.3
Y470完美EFI.rtf
用友U8-ERP数据字典大全
其他资源
TC358746/TC358748完整参考资料包
2016年国赛B题推荐国家奖论文10篇
局部方向模式(LDP)
TI官方2833xflash擦写api文档与库安装文件
2021美赛所有题目
matlab自适应控制程序
iOS美白/灰色/旋转/合成图片(添加文字)
matlab说话人识别
hill密码加密和解密.rar
AndroidDemo
拉格朗日方程讲解PPT
博图V14.txt
IMX294 Datasheet
AI坦克大战
北京大学网络大数据管理与应用大作业:pagerank
格基约减算法
PyQt入门指南
基于opencv的人脸检测
java实现的聊天系统