只为小站
首页
域名查询
文件下载
登录
基于DQN深度
强化学习算法
的水下机器人姿态控制python代码.rar
DQN深度
强化学习算法
, 水下机器人姿态控制, python代码
2021-08-29 20:03:04
10KB
DQN
python代码
姿态控制
基于A2C深度
强化学习算法
的水下机器人姿态控制python代码.rar
A2C深度
强化学习算法
, 姿态控制, python代码
2021-08-29 20:03:03
10KB
A2C深度强化学习
姿态控制
python代码
强化学习算法
:此存储库包含大多数基于pytorch实现的经典深度
强化学习算法
,包括-DQN,DDQN,Dualling Network,DDPG,SAC,A2C,PPO,TRPO。 (更多算法仍在进行中)-源码
深度
强化学习算法
该存储库将使用PyTorch实现经典的深度
强化学习算法
。 该存储库的目的是为人们提供清晰的代码,以供他们学习深度
强化学习算法
。 将来,将添加更多算法,并且还将保留现有代码。 当前实施 深度Q学习网络(DQN) 基本DQN 双Q网络 决斗网络架构 深度确定性策略梯度(DDPG) 优势演员评判(A2C) 信任区域策略梯度(TRPO) 近端政策优化(PPO) 使用克罗内克因素信任区域(ACKTR)的演员评论家 软演员评论(SAC) 更新信息 :triangular_flag: 2018年10月17日-在此更新中,大多数算法已得到改进,并添加了更多关于图的实验(DPPG除外)。 PPO现在支持atari游戏和mujoco-env 。 TRPO非常稳定,可以得到更好的结果! :triangular_flag: 2019-07-15-在此更新中,不再需要为openai基准安装。 我在rl__utils模块中集成了有用的功能。 DDPG也重新实现,并支持更多结果。 自述文件已被修改。 代码结构也有微小的调整。 :triangular_flag: 201
2021-08-29 18:54:48
3.92MB
algorithm
deep-learning
atari2600
flappy-bird
1
Python-OpenAIBaselines
强化学习算法
的高质量实现
OpenAI Baselines:
强化学习算法
的高质量实现
2021-08-02 21:20:51
4.61MB
Python开发-机器学习
1
用
强化学习算法
实现的猫和老鼠游戏代码
这是从国外网站上找到的强化学习的源代码,和大家共同学习。
2021-07-22 21:59:19
56KB
强化学习
1
《用通用
强化学习算法
自我对弈,掌握国际象棋和将棋》
AI 发展日新月异 , 既单一最强 AI AlphaGo 划时代诞生后 , 通用 AI 也呼之欲出 , 而 AlphaZero 的横空出世 , 证明了通用 AI 这条路的可行性 . 从这一刻起 , 人类历史或将被改写 !
2021-07-17 15:05:59
484KB
强化学习
人工智能
对弈
深度学习
1
Python-PyTorch实现的
强化学习算法
集
PyTorch实现的
强化学习算法
集
2021-07-10 16:24:14
482KB
Python开发-机器学习
1
求解部分可观测马氏决策过程的
强化学习算法
针对部分可观测马氏决策过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的
强化学习算法
——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
2021-06-25 14:28:18
339KB
强化学习 部分可观测M
arkov
决策过程 Sarsa
学习 无记忆策略
1
强化学习算法
Pytorch实现全家桶
pytorch框架,主要实现算法有Q-Learning,Sarsa,DQN,DQN-cnn,DoubleDQN,Hierarchical DQN,PG,A2C,SAC,PPO,DDPG,TD3等,能够满足GPU和CPU不同条件,实现模型保存,断点续训,测试结果绘图等,可在此框架魔改你的环境,相当不错。
2021-06-19 19:08:09
147.4MB
pytorch
python
强化学习
深度学习
1
强化学习matlab代码
强化学习算法
,实现强化学习对网络资源的分配,目的是频谱利用最大化
强化学习算法
,实现强化学习对网络资源的分配,目的是频谱利用最大化
2021-05-22 16:44:45
2KB
强化学习算法
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于OpenCV的车牌号码识别的Python代码(可直接运行)
凯斯西储大学(CWRU)轴承数据集(含数据包+整理Python程序+使用说明)
基于hadoop商品推荐系统课程设计
PLECS中文手册.pdf
校园网规划与设计和pkt文件
C4.5决策树算法的Python代码和数据样本
简易示波器-精英板.zip
非线性本构关系在ABAQUS中的实现.pdf
多机器人编队及避障仿真算法.zip
上帝之眼和拾荒者.rar
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
多目标优化算法(四)NSGA3的代码(MATLAB)
先进PID控制Matlab仿真第4版-PDF+代码.zip
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
最新下载
test_pcl.zip
【SHP文件-2022.07】江西省行政区划(省、市、县)+道路网+公路网
School Days HQ GPK文件解包工具
国科大模式识别期末考试题 2016.pdf
运算放大器基本仿真实例
国科大模式识别历年期末试题
牟乃夏-ArcGIS Engine地理信息系统开发教程(基于C#.NET)
东南Dx7多媒体系统升级包
红外星人win10主题
江西省乡镇级区划图 shp格式
其他资源
Modelica&MWorks培训教程
gps基本原理及其matlab仿真
MATLAB智能算法30个案例分析 源代码
JAVA实现简单的机票管理系统
Cadence IC617破解文件
Elasticsearch漏洞检测.rar
TensorFlow实现人脸识别(5)-------利用训练好的模型实时进行人脸检测
opencv-3.3.0-windows版本
C#开发FFMPEG例子(API方式) FFmpeg拉取RTMP流并播放原始源码
批量更改文件名和文件内容
html5播放器完整版
猫与狗的战斗:猫狗大战(使用处理程序)-源码
ucos2教程嵌入式必学教程
中央广播电视大学《机械制图(专科)》期末总复习资料(含答案).pdf
数据架构规划
MobaXterm.rar
Android 中的 Hardware Layer 详解.docx
Teigha_NET_SDK_3.09.10
huitian-spring-boot-starter-demo.zip
HeidiSQL mysql查询工具
5G技术与标准介绍----第6部分:4G与5G共存与互操作-20180623
OpenCV By Example.pdf
structure种群划分软件
后台ui beyondadmin angular版本