只为小站
首页
域名查询
文件下载
登录
基于排序优先
经验回放
的竞争深度Q网络学习
为减少深度Q网络(DQN)算法的训练时间,采用结合优先
经验回放
机制与竞争网络结构的DQN方法,针对Open AI Gym平台cart pole和mountain car两个经典控制问题进行研究,其中
经验回放
采用基于排序的机制,而竞争结构中采用深度神经网络。仿真结果表明,相比于常规DQN算法、基于竞争网络结构的DQN方法和基于优先
经验回放
的DQN方法,该方法具有更好的学习性能,训练时间最少。同时,详细分析了算法参数对于学习性能的影响,为实际运用提供了有价值的参考。
2022-04-13 10:50:11
1.3MB
强化学习
深度Q网络
竞争网络
1
A Novel DDPG Method with Prioritized Experience__Replay.rar
A Novel DDPG Method with Prioritized Experience__Replay.rar
2021-04-08 21:02:40
17.39MB
强化学习
DDPG
经验回放
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
多智能体的编队控制程序的补充(之前上传少了一个文件)
风电场风速及功率数据.zip
Matpower中文使用手册(原名《MATPOWER手册(中文版)》).rar
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
基于MATLAB的水果图像识别
中小型企业网络建设.pkt
transformer_pytorch_inCV.rar
多智能体的编队控制matlab程序(自己编写的,可以运行)
基于LSTM模型的股票预测模型_python
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
Keil5安装包
MPC 模型预测控制matlab仿真程序
基于YOLOV5的车牌定位和识别源码.zip
最新下载
风力气流粒子特效.unitypackage
基于51单片机双路压力监测报警系统设计(仿真与源程序)
STM32战舰版RC522使用例程
Android 开发帮助文档 中文版
GoogleDrive Windows版
梦幻锦衣批量下载-直接切图.zip
x86_64-8.1.0-release-win32-sjlj-rt_v6-rev0.7z
集成光学理论与技术 罗伯特 高清 书签
STM32F407ADC多通道采集DMA传输 额外计算CPU温度均值
子网划分经典例子.doc
其他资源
ISO26262 功能安全文档模板
hslogic算法仿真-基于simulink的飞轮储能发电系统仿真
(Java语言实现的矩阵的基本运算)矩阵的加法乘法
水经注万能地图下载器破解版
RemObjects_SDK_Source_For_Delphi_XE7破解
gis在repast中的应用
三级网络技术知识点小礼包.pdf
AndroidCamera-master.rar
Connector設計參考規範-ALL
强跟踪滤波程序
ext.jsb文件
cgjoy-SimplePath.zip
Linux系统安装部署MySql操作步骤(20200408).txt
msa量测系统分析软件
fastreport fp3Viewer
VB6.0桌面弹球小游戏
Ehlib v6.3.184 VCL D7-X6 Full Source
SSM+Shiro+BootStrap框架整合源码