PyTorch实现软演员- 评论家（SAC），双胞胎延迟DDPG（TD3），演员评论家（AC / A2C），近端策略优化（PPO

pytorch 文档资料人工智能 python

PyTorch实现软演员- 评论家（SAC），双胞胎延迟DDPG（TD3），演员评论家（AC / A2C），近端策略优化（PPO），QT-Opt，PointNet 流行的无模型强化学习算法 PyTorch 和 Tensorflow 2.0 在 Openai 健身房环境和自我实现的 Reacher 环境中实现了最先进的无模型强化学习算法。算法包括：演员兼评论家（AC/A2C）; 软演员-评论家（SAC）; 深度确定性策略梯度（DDPG）; 双延迟 DDPG （TD3）; 近端策略优化; QT-Opt（包括交叉熵（CE）方法）; 点网; 运输机; 经常性政策梯度; 软决策树; 概率专家混合; QMIX Actor-Critic (AC/A2C); Soft Actor-Critic (SAC); Deep Deterministic Policy Gradient (DDPG); Twin Delayed DDPG (TD3); Proximal Policy Optimization (PPO); QT-Opt (including Cross-entropy (CE)

文件下载

资源详情

[{"title":"（ 112 个子文件 2.46MB ） PyTorch实现软演员- 评论家（SAC），双胞胎延迟DDPG（TD3），演员评论家（AC / A2C），近端策略优化（PPO","children":[{"title":".gitmodules 239B ","children":null,"spread":false},{"title":"qt_opt_v3.py 12.13KB ","children":null,"spread":false},{"title":"events.out.tfevents.1577364245.quantumiracle-G3-3579 237.07KB ","children":null,"spread":false},{"title":"ddpg.py 12.31KB ","children":null,"spread":false},{"title":"_policies.py 588B ","children":null,"spread":false},{"title":"......","children":null,"spread":false},{"title":"文件过多，未全部展示","children":null,"spread":false}],"spread":true}]

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

PyTorch实现软演员- 评论家（SAC），双胞胎延迟DDPG（TD3），演员评论家（AC / A2C），近端策略优化（PPO

文件下载

资源详情

评论信息

其他资源

免责申明

个人信息

相关资源标签

热门下载

最新下载