只为小站
首页
域名查询
文件下载
登录
c++复现标准版的策略梯度算法内含数据集以及训练预测脚本
策略梯度(Policy Gradient, PG)方法的核心思想在于是能获得更好的回报的动作的采样概率不断提高,使获得更少回报的动作的采样概率不断降低,从而达到一个最优的策略。
2022-10-22 09:07:51
7KB
libtorch
vpg
DeepReinforcementLearning:深度RL实施。 在pytorch中实现的DQN,SAC,DDPG,TD3,PPO和
VPG
。 经过测试的环境:LunarLander-v2和Pendulum-v0-源码
使用Pytorch实现的深度RL算法 算法列表: 关于深入探讨 实验结果: 算法 离散环境:LunarLander-v2 连续环境:Pendulum-v0 DQN --
VPG
-- DDPG -- TD3 -- SAC -- PPO -- 用法: 只需直接运行文件/算法。 在我学习算法时,它们之间没有通用的结构。 不同的算法来自不同的来源。 资源: 未来的项目: 如果有时间,我将为使用RL的电梯添加一个简单的程序。 更好的图形
2021-04-26 01:35:45
391KB
algorithms
ddpg
sac
ppo
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
大唐杯资料+题库(移动通信)
RNN-LSTM卷积神经网络Matlab实现
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
王万良-人工智能导论(第五版)课件
quartus II13.0器件库.zip
多智能体的编队控制程序的补充(之前上传少了一个文件)
EasyMedia-ui.zip
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
西安问题电缆-工程伦理案例分析.zip
西门子逻辑控制设计开发_3部10层
云视通端口扫描器.rar
超大规模集成电路先进光刻理论与应用.pdf
机械臂避障路径规划仿真 蚁群算法 三维路径规划
最新下载
PHP留言板小项目(大作业)
spark新能源汽车推荐系统(附源码+数据库)42422
Arduino框架的ESP8266和ESP32的SDK离线安装包截止2023年2月7日最新稳定版
DOS汇编工具包(DosBox, MASM5.0, Edit)
基于MATLAB条形码识别GUI版.zip
用卷积神经网络实现彩色图像的超分辨率matlab.zip
西门子smat 200 PLC和施耐德伺服LMX23系列脉冲运行
野火stm32f103zet6pwm输出
unity 3D材质库:大自然、天空、建筑、木材等,版本较早.zip
和利时 OPC软件授权
其他资源
[C++大学教程 C++ How to program(第九版)]课后习题源代码.rar
FLUENT 2020R2 tutorial guide PDF及案例源文件
PSCAD中微电网定直流电压控制、PQ控制的多种分布式电源(光伏、风机等)并网模型
MPU6050姿态解算STM32源码(卡尔曼滤波)
ssim的MATLAB算法程序
康熙字典数据库SQL包含笔画五行解释
最小二乘影像匹配程序(matlab)
LMS算法自适应波束形成
labVIEW实例
数据结构,西北大学
UPS仿真报告matlab
IMagineworldClient_ML_V02.00.02.26
lombscargle.m
CRM管理系统、教育后台、试听课、教师、学生、客户、学员、科目、优惠券、完课回访、客户管理系统、收费、退费、回访、账号权限、订单流水.zip
一种基于等价关系的模糊多属性语言决策方法
802.3ad中文版
蓝色简约时间管理培训PPT模板.pptx
java项目演示第12期一款校园二手市场系统.zip
windows用php7的memcache所有版本dll
basic_excel excel开源读写库[修正bug]
电梯MCGS仿真
BigDog The Rough-Terrain Robot
外汇EA信号交易发布接收综合版3.01D929.rar