只为小站
首页
域名查询
文件下载
登录
DeepReinforcementLearning:深度RL实施。 在pytorch中实现的DQN,SAC,DDPG,
TD3
,PPO和VPG。 经过测试的环境:LunarLander-v2和Pendulum-v0-源码
使用Pytorch实现的深度RL算法 算法列表: 关于深入探讨 实验结果: 算法 离散环境:LunarLander-v2 连续环境:Pendulum-v0 DQN -- VPG -- DDPG --
TD3
-- SAC -- PPO -- 用法: 只需直接运行文件/算法。 在我学习算法时,它们之间没有通用的结构。 不同的算法来自不同的来源。 资源: 未来的项目: 如果有时间,我将为使用RL的电梯添加一个简单的程序。 更好的图形
2021-04-26 01:35:45
391KB
algorithms
ddpg
sac
ppo
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
多目标优化算法(四)NSGA3的代码(python3.6)
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
韦来生《数理统计》课后习题与答案
多智能体的编队控制matlab程序(自己编写的,可以运行)
计算机专业实习日记+实习周记+实习总结
EasyMedia-ui.zip
粒子群算法优化3-5-3多项式工业机器人时间最优轨迹规划算法matlab代码
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
2019年秋招—华为硬件工程师笔试题目.pdf
simulink仿真实现光伏发电MPPT+能量管理
voc车辆检测数据集(已处理好,可直接训练)
VideoDownloadHelper去除120分钟时间限制-高级版.zip
opcua服务器模拟器+opcua客户端工具.rar
基于matlab扩频通信系统仿真(整套代码)
最新下载
PRTG Network Monitor 17.3.33.2753.rar
华为USG6000V500R001C30SPC100.bin,V1升级V5过渡包
3KW工业变频器解决方案
医院核心业务系统密码应用建设方案(2023版).pdf
微信小程序开发合同签订.docx
Delphi 12 控件之Delphi 12.2 中英文一键切换助手(含操作说明)- 适用 29.0.53571.9782.ra
maven jar包
管调通V2.15.apk
IPv4 CIDR地址计算器
虚拟声卡 Virtual Audio Cable V4.10(无女trail音+原理说明)
其他资源
fanuc robot interfaceV3.0.rar
ZEMAX 光学设计超级学习手册-素材文件.rar
matlab中.mat数据格式转换为txt格式
opengl片元着色器HSV转RGB和RGB转HSV源码
stm32F103实现HID自定义复合设备
QT + ffmpeg + sdl音频播放器
TXT格式的牛津英汉词典
电影院网上售票系统php+css+mysql
matlab实现smith圆图
安氏领信LTAP3000无线AP固件 OPENWRT固件 带不死BREED
EPop激活工具
HoudiniURP流体下载地址.txt
STL常用函数自己总结的
PXA270助手 底层开发
totaluninstall627pjb.7z
VC利用WORD替换功能打印发票
全国省市区json数据(来自高德地图)
protobuf-cpp-3.1.0.tar.gz
SBO及SQL安装ppt教程
声学手册,Master handbook of Acoustics(fifth edition)
parasoft c++ test 9.0.0.155 插件版+破解 part1
基于遗传算法和非线性规划的函数寻优算法
NuGet Package Manager vsix插件(含vs2010.203.2015)
曲线拟合-散点图平滑化曲线自动生成
基于图像的自动识别技术