只为小站
首页
域名查询
文件下载
登录
基于多维状态动作的
DDPG
冲突解脱算法研究
本文利用 Gym 对仿真环境进行注册,对 OpenScope 进行功能性改造,引入 成都双流机场最新进近区域内的固定点数据,包括各个扇区参数、进离场航线数据、进 近区管辖范围数据等,设计了简单的进近区 ATC 管制环境。该环境包括独立的进场、离 场情景,充分考虑了各种复杂情况下的冲突。其次,针对不同空域的复杂程度设计了相 应的冲突场景,如航路上的交叉冲突以及对头冲突,进、离场时的对头冲突、超越冲突 等,构建完备的冲突集。为了降低模型的复杂度,假设航空器在转弯过程中不考虑最小 转弯半径的限制。最后,考虑到解脱动作的连续性以及智能体状态的复杂性,本文以保 障飞行安全为前提,对航空器解脱策略进行研究。通过构建的空中交通管制仿真环境实 现智能体之间的交互训练任务,设计了冲突解脱模型的奖励函数,采用深度强化学习中 经典算法
DDPG
进行解脱策略的学习。仿真实验结果表明该算法对于多种冲突环境均 能够搜索到较优的解脱策略,冲突解脱成功率达到 89% 以上,可以作为管制员进行冲 突解脱的参考方案之一。
2022-01-04 13:01:40
11.77MB
空中交通管制
冲突探测与解脱
深度强化学习
DDPG
ddpg
_algorithm:
ddpg
算法的实现-源码
ddpg
_algorithm:
ddpg
算法的实现
2021-12-30 12:43:43
1.23MB
Python
1
ddpg
源码
ddpg
源码
2021-12-24 11:01:46
2KB
ddpg源码
torchrl:强化学习算法的Pytorch实现(软演员评论员(SAC)
DDPG
TD3 DQN A2C PPO TRPO)-源码
火炬RL RL方法的Pytorch实现 支持具有连续和离散动作空间的环境。 支持具有1d和3d观察空间的环境。 支持多进程环境 要求 一般要求 火炬1.7 健身房(0.10.9) Mujoco(1.50.1) 列表(用于日志) tensorboardX(日志文件输出) 张量板要求 Tensorflow:启动tensorboard或读取tf记录中的日志 安装 使用use environment.yml创建虚拟环境 conda create -f environment.yml source activate py_off 手动安装所有要求 用法 在配置文件中指定算法的参数,并在参数中指定日志目录/种子/设备 python examples/ppo_continuous_vec.py --config config/ppo_halfcheetah.json --seed 0 --device 0 --id ppo_halfcheetah 结帐示例文件夹以获取详细信息 目前包含: 政策上的方法: 加强 A2C(演员评论家) PPO(近端政策优化)
2021-11-23 11:43:20
170KB
algorithm
reinforcement-learning
pytorch
dqn
1
Deep-learning-for-a-robot-arm:BSc毕业项目-
DDPG
算法,用于解决到达和跟踪线问题-源码
机器人手臂的深度学习 实现强化学习算法之一(
DDPG
深度确定性Ploicy梯度),以控制机械臂。 该项目的目标是从安装在机器人上,以电机命令在一个端对端方式的照相机来映射特征。 推介会: 有关该项目的演示文稿,可以在这里找到: 二手工具和技术: Python 2.7 TensorFlow 1.5.1 OpenCV Vrep RemoteAPI 皮塞里亚尔 任务: 在工作空间中到达对象: 环境文件: 算法实现: 遵循黑线: 环境文件: 算法实现:
2021-11-22 22:14:39
3.9MB
Python
1
RLContinuousActionSpace:在连续状态和动作空间中进行强化学习。
DDPG
-源码
RLContinuousActionSpace 在连续状态和动作空间中进行强化学习。
DDPG
:深度确定性策略梯度和A3C:异步Actor-Critic代理 注意:环境是随机填充的查找表和模拟物理模型的常量的任意组合。 1°
DDPG
: 基于带有深度强化学习的持续控制: : 和来自精彩博客。 这种方法结合了DDQN算法(体验重播和目标网络)的优势以及可输出连续动作的行为者批评结构。 该算法首先在健身房开放式平台的pendulum-v0游戏中进行了验证,然后应用于定制的Envonement EnvPlant.py,模拟了温度模型: OU.py:探索是通过Ornstein-Uhlenbeck过程完成的,它具有便利的均值回复特性。 Models.py:演员,评论家和目标网络的神经网络 演员模型 批评模型 main.py:配置,训练,测试,显示,存储,加载 ReplayBuffer.py
2021-11-19 17:06:34
1.9MB
Python
1
强化学习源码(DP, MC, TD, DQN, PG, AC, A3C,
DDPG
).zip
包括DP, MC, TD, TD-lambda, DQN, PG, AC, A3C,
DDPG
, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码
2021-10-14 16:17:05
32.58MB
强化学习
1
DeepRLPID-main.zip
DDPG
调节PID参数
2021-10-13 18:04:30
75KB
DDPG
1
5.
ddpg
.ipynb
关于
ddpg
的例子,适合初学者对深度强化学习
ddpg
的认识和了解
2021-09-19 20:51:55
43KB
ddpg
1
machin:专为PyTorch设计的强化学习库(框架),实现了DQN,
DDPG
,A2C,PPO,SAC,MA
DDPG
,A3C,APEX,IMPALA ..-源码
可读,可重用,可扩展 Machin是为pytorch设计的增强库。 支持的型号 任何事物,包括循环网络。 支持的算法 当前,Machin已实现以下算法,该列表仍在增长: 单代理算法: 多主体算法: 大规模并行算法: 增强功能: 支持的算法: 进化策略 基于模型的方法 特征 1.可读 与其他强化学习库(例如著名的 , 和。 Machin尝试仅提供RL算法的简单明了的实现。 Machin中的所有算法均以最小的抽象设计,并具有非常详细的文档以及各种有用的教程。 2.可重复使用 Machin采用与pytorch类似的方法,将算法和数据结构封装在自己的类中。 用户无需设置一系列data collectors , trainers , runners , samplers ...即可使用它们,只需导入即可。 模型上的唯一限制是它们的输入/输出格式,但是,这些限制很小,可以轻松地使算法适
2021-09-17 19:09:16
1.54MB
python
reinforcement-learning
deep-learning
gae
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
校园网规划与设计和pkt文件
BP_PID控制仿真.rar
RNN-LSTM卷积神经网络Matlab实现
科研伦理与学术规范 期末考试2 (40题).pdf
全国河流水文站坐标.xls
长江流域shp.zip
雷达信号处理仿真程序(MTI,MTD等)
RentingSystem.rar
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
PLECS中文手册.pdf
东南大学英语技术写作慕课所有答案
VideoDownloadHelper去除120分钟时间限制-高级版.zip
python实现的学生信息管理系统—GUI界面版
Android小项目——新闻APP(源码)
pytorch实现RNN实验.rar
最新下载
Gamebryo2.6 带源码完整版(20.6.0.0b)
Y400&Y500 BIOS Back And Recovery.zip
KViewer专业医学病理切片查看软件(K-Viewer),适用于医学生不知道怎么打开KFB格式文件
Java Swing图形界面开发与案例详解及随书实例代码
西门子S7-200PLC实验指导书.pdf
LeapDeveloperKit_3.2.1+45911_win.zip
蘑菇数据集:蘑菇数据集分析-源码
PSCAD V5 电路设计与仿真从入门到精通
联想超融合AIO H1000 V4.5.2 使用手册 R1.0 2021.01.11.pdf
QT-5.15.0 Linux版本静态开发库文件
其他资源
(修改后)turbo系统 matlab 仿真代码 参考Dr.Wuyufei 有详细注释
2018年最新中国行政区划代码省市区县MySQL数据库单表,包含港澳台,最新整理,严禁盗版
基于STM32的小车蓝牙程序
The Mathematical Theory of Finite Element Methods
北邮数值与符号计算实验 快速傅里叶变换及其应用
QGDW1906-2013输变电一次设备缺陷分类标准
51单片机温度报警器设计(程序及proteus仿真)
VNX5400-硬件信息指南
wifi 小车控制+视频接收
列表库GridCtrl,包含源码、说明和两种实现合并单元格功能的库
matlab代码实现图像亮度增强
FPGA实现PID模糊控制
OpenGL库文件完整版
代数学引论(聂灵沼 丁石孙)课件
PidevJobCore-源码
深信短信安装文件_开源无加密纯净版.zip
linux查看现有占用端口命令netstat –ntlp.docx
2019 Mock Exam A - Morning Session.pdf
信号与系统.zip
COMPUTATIONAL COMPLEXITY A Modern Approach
java做的一个定时提醒软件
设计模式完整视频
C#WebBrowser导出网页所有图片
shiro 中文 API文档
axure元件库
EDA技术篮球比赛电子记分牌
硬盘、U盘数据恢复软件
matlab2013激活文件