DQN深度强化学习算法, 水下机器人姿态控制, python代码
2021-08-29 20:03:04 10KB DQN python代码 姿态控制
A2C深度强化学习算法, 姿态控制, python代码
深度强化学习算法 该存储库将使用PyTorch实现经典的深度强化学习算法。 该存储库的目的是为人们提供清晰的代码,以供他们学习深度强化学习算法。 将来,将添加更多算法,并且还将保留现有代码。 当前实施 深度Q学习网络(DQN) 基本DQN 双Q网络 决斗网络架构 深度确定性策略梯度(DDPG) 优势演员评判(A2C) 信任区域策略梯度(TRPO) 近端政策优化(PPO) 使用克罗内克因素信任区域(ACKTR)的演员评论家 软演员评论(SAC) 更新信息 :triangular_flag: 2018年10月17日-在此更新中,大多数算法已得到改进,并添加了更多关于图的实验(DPPG除外)。 PPO现在支持atari游戏和mujoco-env 。 TRPO非常稳定,可以得到更好的结果! :triangular_flag: 2019-07-15-在此更新中,不再需要为openai基准安装。 我在rl__utils模块中集成了有用的功能。 DDPG也重新实现,并支持更多结果。 自述文件已被修改。 代码结构也有微小的调整。 :triangular_flag: 201
2021-08-29 18:54:48 3.92MB algorithm deep-learning atari2600 flappy-bird
1
基于UDTL的智能诊断基准 代码发布,张启阳和余晓磊的。 更正 2020.06.02,我们修改了util / train_utils_combines中的错误。 (class_num-> num_classes)。 指导 该项目仅提供基线(下限)精度和基于无监督深度转移学习(UDTL)的统一智能故障诊断库,该库为每个人保留了扩展的接口,以供他们自己加载自己的数据集和模型以进行新的研究。 同时,所有实验都是通过在装有Intel Core i7-9700K,GeForce RTX 2080Ti和16G RAM的计算机上运行,​​在Window 10和Pytorch 1.3下执行的。 要求 Python 3.7 脾气暴躁的1.16.2 熊猫0.24.2 泡菜 tqdm 4.31.1 斯克莱恩0.21.3 Scipy 1.2.1 OpenCVPython的4.1.0.25 PyWav
2021-08-24 21:47:12 187KB 系统开源
1
cnn源码matlab #基于深度迁移学习对JPEG图像进行隐写分析 keywords:deep learning,transfer learning,steganalysis ##内容介绍 DCTR_matlab:使用MATLAB实现的残差图像的离散余弦变换算法。 SRNet:隐写分析残差网络实现,CNN网络中加入深度学习短连接(shortcut connections)的残差层。 log:保存tensorboard可视化查看日志文件,可在网页localhost:6060中打开,观察网络和张量的变化以及进行loss,acc曲线图的绘制等。 savemodel:训练过程中保存的训练模型。 conv.py:CNN网络的卷积层等部分,主要用来进行隐写特征提取。 dataload.py:对JPEG图像进行处理生成网络能够读取的格式。 dctr.py:对JPEG图像进行DCTR(残差图像的离散余弦变换)进行DCT基核滤波提取图像在变换域(频域空间)的隐写特征,以及使用高通滤波器进行空间域的特征提取。 distance:计算源域和目标域数据的KV核距离(高斯核和线性核)。 others.py:用
2021-08-24 16:14:27 19.06MB 系统开源
1
David Silver的强化学习基本上算是强化学习的入门视频,学习强化学习的人必看。这是David Silver强化学习课程学习笔记,除了视频里的内容,每一章节末尾附加了练习,便于实现和理解算法
2021-08-23 15:06:15 3.56MB RL 强化学习 深度强化学习 David
1
深度强化学习研究进展.pdf
2021-08-20 01:39:49 3.51MB 深度学习 数据分析 数据研究 参考文献
基于深度强化学习的计步方法.pdf
2021-08-20 01:39:26 1017KB 深度学习 数据分析 数据研究 参考文献
基于深度迁移学习的车辆信息识别方法.pdf
2021-08-20 01:39:08 5.48MB 深度学习 数据分析 数据研究 参考文献
基于深度强化学习的航天信息综合应用与决策研究.pdf
2021-08-19 09:39:38 1.37MB 深度学习 数据分析 数据研究 参考文献