只为小站
首页
域名查询
文件下载
登录
DeepReinforcementLearning:深度RL实施。 在pytorch中实现的DQN,SAC,DDPG,
TD3
,PPO和VPG。 经过测试的环境:LunarLander-v2和Pendulum-v0-源码
使用Pytorch实现的深度RL算法 算法列表: 关于深入探讨 实验结果: 算法 离散环境:LunarLander-v2 连续环境:Pendulum-v0 DQN -- VPG -- DDPG --
TD3
-- SAC -- PPO -- 用法: 只需直接运行文件/算法。 在我学习算法时,它们之间没有通用的结构。 不同的算法来自不同的来源。 资源: 未来的项目: 如果有时间,我将为使用RL的电梯添加一个简单的程序。 更好的图形
2021-04-26 01:35:45
391KB
algorithms
ddpg
sac
ppo
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于yolov4-keras的抽烟检测(源码+数据集)
C4.5决策树算法的Python代码和数据样本
token登录器.rar
多机器人编队及避障仿真算法.zip
RNN-LSTM卷积神经网络Matlab实现
matpower5.0b1.zip
韦来生《数理统计》课后习题与答案
2019和2021年华为单板通用硬件笔试题及答案
粒子群多无人机协同多任务分配.zip
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
CNN卷积神经网络Matlab实现
大唐杯资料+题库(移动通信)
pytorch实现RNN实验.rar
20200318附加-2019年电赛综合测评方案详细计算过程(pdf版本,有朋友反映word版本乱码,特意转为pdf)
最新下载
硬件工程师面经整理6-运放相关
silverlight 5下载全
modbusTcp例子
HFSS天线设计源文件.zip
modbus_tcp_server(codesys)
哈工大制造系统自动化技术期末考试绝佳复习资料.doc
opendtect6.3下载
最新ISO10373规范标准
操作系统课设计 SPOOLing系统
Python-电信用户流失预测
其他资源
VS2008-VS2017番茄助手(Visual AssistX)破解版亲测可用
BCGCBPRO2210d.dll_BCGCBPRO2210.dll_BCGCBPRO2210.lib_BCGCBPRO2210d.lib
Java软件开发实习报告
JESD209-4B_Low Power Double Data Rate 4 (LPDDR4).pdf
校园失物招领系统原创开源源码
JAVA学生在线选课系统的设计与实现
QT tcp 聊天室
基于bootstrap的简洁登录界面Html
eclipse-java-google-style
SapphireRX560D03.rom
DecisionTree:决策树算法的C ++实现-源码
Flowjo_V10
3.数字逻辑电路.pdf
中控考勤机
《数据结构与算法课程设计》报告模板-.docx
HTML5捕鱼达人源码
JavaFX战旗类游戏开发示例
c#实战:利用c#开扫雷游戏代码
LED8N收银客户显示屏幕开发示例
KDD CUP 2012全部论文
FLY3D2.0 完整的教学3D引擎
气体传感器浓度ADC数据采集及WIFI发送