只为小站
首页
域名查询
文件下载
登录
强化学习入门经典论文(
DQN
相关).rar
强化学习必读论文
2021-10-23 22:42:26
13.6MB
DQN
1
强化学习源码(DP, MC, TD,
DQN
, PG, AC, A3C, DDPG).zip
包括DP, MC, TD, TD-lambda,
DQN
, PG, AC, A3C, DDPG, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码
2021-10-14 16:17:05
32.58MB
强化学习
1
DQN
_by_keras-master.rar
用keras搭建
DQN
网络,实现走迷宫
2021-10-13 18:04:09
13KB
强化学习
迷宫
DQN
1
2018-surf-
dqn
-forex:XJTLU SURF项目-源码
金融投资组合选择和自动交易中的Q学习 Policy Gradient和Q-Learning是强化学习(机器学习的一个分支)中的技术,而后者由于在视频游戏和与人类专家进行的Game of Go比赛中的胜利而具有较高的知名度。 但是,由于问题学习中连续的行动空间,强化学习在金融投资组合管理问题上的成功应用以前大多限于“策略梯度”变体。 在这个项目中,我们将采用一种简单的离散化方案,以使问题适合于不连续的Q学习技术。 然后,将通过其在其他更成熟的方法上的性能来检验这种方法的有效性。 可能的方法 使用 使用 使用 从零开始的代码 ...
2021-10-11 17:03:40
2.08MB
Python
1
keras搭建
DQN
训练Flappybird模型.zip
keras搭建
DQN
,构建FlappyBird智能体的模型,分别训练200轮以及github上下载的292轮模型
2021-09-30 17:05:25
21.23MB
keras
1
强化学习
DQN
这本书详细介绍了强化学习的常用算法以及算法原理,从蒙特卡罗方法到Q_learning最终到
DQN
2021-09-28 19:29:44
1.51MB
强化学习
深度学习
1
machin:专为PyTorch设计的强化学习库(框架),实现了
DQN
,DDPG,A2C,PPO,SAC,MADDPG,A3C,APEX,IMPALA ..-源码
可读,可重用,可扩展 Machin是为pytorch设计的增强库。 支持的型号 任何事物,包括循环网络。 支持的算法 当前,Machin已实现以下算法,该列表仍在增长: 单代理算法: 多主体算法: 大规模并行算法: 增强功能: 支持的算法: 进化策略 基于模型的方法 特征 1.可读 与其他强化学习库(例如著名的 , 和。 Machin尝试仅提供RL算法的简单明了的实现。 Machin中的所有算法均以最小的抽象设计,并具有非常详细的文档以及各种有用的教程。 2.可重复使用 Machin采用与pytorch类似的方法,将算法和数据结构封装在自己的类中。 用户无需设置一系列data collectors , trainers , runners , samplers ...即可使用它们,只需导入即可。 模型上的唯一限制是它们的输入/输出格式,但是,这些限制很小,可以轻松地使算法适
2021-09-17 19:09:16
1.54MB
python
reinforcement-learning
deep-learning
gae
1
Reinforcement-Learning:使用Q学习,
DQN
和D
DQN
进行强化学习-源码
强化学习 深度学习:优化 创建人:Vithurshan Vijayachandran和Hisho Rajanathan RLearning_NOTEBOOK.ipynb-适用于基本(Q学习)和高级任务(
DQN
和D
DQN
)的Jupyter笔记本。 RL_Rport.pdf:报告所有研究结果和评估。 使用以下预训练模型来测试网络,因为重新训练非常耗时。
DQN
TrainingModel.h5-测试
DQN
网络所需的文件 D
DQN
TrainingModel.h5-测试D
DQN
网络所需的文件 D
DQN
PERTrainingModel.h5 =使用PER网络测试D
DQN
所需的文件
2021-09-14 10:57:27
2.5MB
JupyterNotebook
1
DQN
机器学习
通过
DQN
的模型,实现机器学习,并且进行统计。练手的DEMO。
2021-09-07 21:57:12
4KB
python
机器学习
1
4.7* Dueling
DQN
using Tensorflow (强化学习 Reinforcement Learning 教学)
#4.7*_Dueling_
DQN
_using_Tensorflow_(强化学习_Reinforcement_Learning_
2021-09-01 21:00:23
16.83MB
学习资源
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
数字图像处理[冈萨雷斯]
Android大作业——网上购物APP(一定是你想要的)
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
java-spring-web-外文文献翻译40篇.zip
云视通端口扫描器.rar
基于Matlab的PI/4 DQPSK的调制解调源代吗
BP神经网络+PID控制simulink仿真
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
opcua服务器模拟器+opcua客户端工具.rar
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
商用密码应用与安全性评估——霍炜.pdf
EEupdate_5.35.12.0 win10下修改intel网卡mac
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
android开发期末大作业.zip
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
最新下载
电动轮椅车设计【含全套CAD图纸和WORD说明书】.pdf
西南交通大学现代通信原理课设
三菱大型PLC R系列手册+学习资料
poi-3.12-android-a.jar和poi-ooxml-schemas-3.12-20150511-a.jar
基于ssh电影后台管理系统代码
牟乃夏-ArcGIS Engine地理信息系统开发教程(基于C#.NET)
标准C中多层组织中光传输的蒙特卡洛建模——翻译版本
小软件POI数据下载神器
国际10-20系统脑电极分布VISO图图.vsdx
校园导游系统课程设计报告
其他资源
SQL Server Native Client 10.0 驱动
基于COMSOL Multiphysics的MEMS建模及应用
G502 FPS 通用压枪宏
USB3.0A封装库
vc++ 修改IP地址DNS 附带源码
倍福CX8080控制器使用手册
Pulse Sensor 驱动程序
tableau超市数据实战
电池BMS板原理图
数据结构大项目(家谱管理系统)
软件测试计划范例
天天(泊君)伪原创破解版(可注册)
【ssm项目源码】房屋租赁管理系统.zip
MVP-Simple-Demo-master.zip
音视频知识分享.pptx
C# 小游戏实例(含代码)
GM开区建站专家5.5免费下载
java springmvc微信,微博,linkin,新浪第三方登录,facebook
Android仓库管理
网上宠物商店系统JSP+JavaBean+JDBC
WM算法实现_敏感词过滤
710枚白色图标 + 204个win10风格图标
远程备份MySQL数据库