只为小站
首页
域名查询
文件下载
登录
强化学习入门经典论文(DQN相关).rar
强化学习必读论文
2021-10-23 22:42:26
13.6MB
DQN
1
强化学习源码(DP, MC, TD, DQN, PG, AC, A3C, DDPG).zip
包括DP, MC, TD, TD-lambda, DQN, PG, AC, A3C, DDPG, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码
2021-10-14 16:17:05
32.58MB
强化学习
1
DQN_by_keras-master.rar
用keras搭建DQN网络,实现走迷宫
2021-10-13 18:04:09
13KB
强化学习
迷宫
DQN
1
2018-surf-dqn-forex:XJTLU SURF项目-源码
金融投资组合选择和自动交易中的Q学习 Policy Gradient和Q-Learning是强化学习(机器学习的一个分支)中的技术,而后者由于在视频游戏和与人类专家进行的Game of Go比赛中的胜利而具有较高的知名度。 但是,由于问题学习中连续的行动空间,强化学习在金融投资组合管理问题上的成功应用以前大多限于“策略梯度”变体。 在这个项目中,我们将采用一种简单的离散化方案,以使问题适合于不连续的Q学习技术。 然后,将通过其在其他更成熟的方法上的性能来检验这种方法的有效性。 可能的方法 使用 使用 使用 从零开始的代码 ...
2021-10-11 17:03:40
2.08MB
Python
1
keras搭建DQN训练Flappybird模型.zip
keras搭建DQN,构建FlappyBird智能体的模型,分别训练200轮以及github上下载的292轮模型
2021-09-30 17:05:25
21.23MB
keras
1
强化学习DQN
这本书详细介绍了强化学习的常用算法以及算法原理,从蒙特卡罗方法到Q_learning最终到DQN
2021-09-28 19:29:44
1.51MB
强化学习
深度学习
1
machin:专为PyTorch设计的强化学习库(框架),实现了DQN,DDPG,A2C,PPO,SAC,MADDPG,A3C,APEX,IMPALA ..-源码
可读,可重用,可扩展 Machin是为pytorch设计的增强库。 支持的型号 任何事物,包括循环网络。 支持的算法 当前,Machin已实现以下算法,该列表仍在增长: 单代理算法: 多主体算法: 大规模并行算法: 增强功能: 支持的算法: 进化策略 基于模型的方法 特征 1.可读 与其他强化学习库(例如著名的 , 和。 Machin尝试仅提供RL算法的简单明了的实现。 Machin中的所有算法均以最小的抽象设计,并具有非常详细的文档以及各种有用的教程。 2.可重复使用 Machin采用与pytorch类似的方法,将算法和数据结构封装在自己的类中。 用户无需设置一系列data collectors , trainers , runners , samplers ...即可使用它们,只需导入即可。 模型上的唯一限制是它们的输入/输出格式,但是,这些限制很小,可以轻松地使算法适
2021-09-17 19:09:16
1.54MB
python
reinforcement-learning
deep-learning
gae
1
Reinforcement-Learning:使用Q学习,DQN和DDQN进行强化学习-源码
强化学习 深度学习:优化 创建人:Vithurshan Vijayachandran和Hisho Rajanathan RLearning_NOTEBOOK.ipynb-适用于基本(Q学习)和高级任务(DQN和DDQN)的Jupyter笔记本。 RL_Rport.pdf:报告所有研究结果和评估。 使用以下预训练模型来测试网络,因为重新训练非常耗时。 DQNTrainingModel.h5-测试DQN网络所需的文件 DDQNTrainingModel.h5-测试DDQN网络所需的文件 DDQNPERTrainingModel.h5 =使用PER网络测试DDQN所需的文件
2021-09-14 10:57:27
2.5MB
JupyterNotebook
1
DQN机器学习
通过DQN的模型,实现机器学习,并且进行统计。练手的DEMO。
2021-09-07 21:57:12
4KB
python
机器学习
1
4.7* Dueling DQN using Tensorflow (强化学习 Reinforcement Learning 教学)
#4.7*_Dueling_DQN_using_Tensorflow_(强化学习_Reinforcement_Learning_
2021-09-01 21:00:23
16.83MB
学习资源
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2010年-2020中国地面气候资料数据集(V3.0)
IBM CPLEX 12.10 学术版 mac操作系统安装包
avantage 软件 xps 处理软件30天后不能使用问题
BP神经网络+PID控制simulink仿真
ios无人直播 虚拟视频实用版 可以导入视频
基于蒙特卡洛生成电动汽车充电负荷曲线程序
2020年数学建模B题(国二)论文.pdf
transformer_pytorch_inCV.rar
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
多目标优化算法(四)NSGA3的代码(MATLAB)
知网情感词典(HOWNET)
锁相环simulink建模仿真.rar
DBSCAN算法Matlab实现
基于STM32的FFT频谱分析+波形识别
基于VMD算法的信号降噪.rar
最新下载
SF-107601-LS-64_Solarflare_Linux_Utilities_RPM_64bit.zip
AMW排孔1.4.1.gh
史上最全:HP模板227个+软景模板81个
天文算法英文版——jean meeus
Web安全之强化学习与GAN
openPlant 数据库驱动jar包
TCLeditor For OpenSees.0.4.7z
GH100案例-思路花语 (1).pdf
微信hook(3.9.10.19)
k2t 刷机工具包
其他资源
Lena图像处理经典图片
peter J. Brockwell time series 答案
商业银行信息科技风险现场检查指南
台服全等级补丁大全防炸服
编译原理语义分析java实现
CentOS7下部署Django项目详细操作步骤
matalab三维多项式拟合
正六边形网格地图A*算法的实现
Coursera machine learning答案
贝叶斯分类算法C++实现
基于java的医院一卡通系统.
QT实现多人屏幕共享系统.rar
全国行政区划shapefile
一类含不确定项的离散混沌系统的同步控制
微软分布式机器学习工具包 DMTK 综述 .pdf
一种基于HCPL-316J的IGBT驱动电路设计
软件测试入门电子书(适合初学者)
索爱解锁工具
java13英文文档 jdk-13.0.1_doc-all.zip
基于QT开发的员工管理系统
简易购物车asp源码绝对可用
java基础,数据库,框架,微服务面试相关复习知识汇总
一种图纸数字化程序的C#编程实现