只为小站
首页
域名查询
文件下载
登录
Metal–Organic Frameworks Opportunities for Catalysis.pdf
Metal–Organic Frameworks Opportunities for Catalysis.pdf
2021-02-07 14:02:35
828KB
强化学习
1
Reinforcement Learning-Theory and Algorithm.pdf
关于强化学习的基础材料
2021-02-04 15:09:33
652KB
强化学习
1
sumo-all-1.7.0.tar.gz
sumo-all-1.7.0.tar.gz 强化学习SUMO1.7.0平台安装包
2021-02-04 13:02:08
205.4MB
SUMO
强化学习
1
sumo-src-1.8.0.tar.gz
sumo-src-1.8.0.tar.gz SUMO1.8.0
2021-02-04 13:02:08
49.03MB
SUMO
强化学习
1
MDPtoolbox(MDP工具箱)
MATLAB的MDP工具箱(马尔可夫决策过程工具箱),内含MATLAB代码以及代码说明。(注:本资源是截止至2021年2月的最新工具箱)。其中代码说明在documentation文件夹下,文件夹内为网页链接,双击打开网页链接后即为代码说明,代码说明中包括example。
2021-02-03 12:11:51
393KB
matlab
强化学习
1
imitation_learning:PyTorch实现的一些强化学习算法:优势演员评论(A2C),近距离策略优化(PPO),V-MPO,行为克隆(BC)。 将添加更多算法-源码
模仿学习 此仓库包含一些强化学习算法的简单PyTorch实现: 优势演员评论家(A2C) 的同步变体 近端策略优化(PPO)-最受欢迎的RL算法 , ,, 策略上最大后验策略优化(V-MPO)-DeepMind在其上次工作中使用的算法 (尚不起作用...) 行为克隆(BC)-一种将某些专家行为克隆到新策略中的简单技术 每种算法都支持向量/图像/字典观察空间和离散/连续动作空间。 为什么回购被称为“模仿学习”? 当我开始这个项目并进行回购时,我认为模仿学习将是我的主要重点,并且无模型方法仅在开始时用于培训“专家”。 但是,PPO实施(及其技巧)似乎比我预期的花费了更多时间。 结果,现在大多数代码与PPO有关,但是我仍然对模仿学习感兴趣,并打算添加一些相关算法。 当前功能 目前,此仓库包含一些无模型的基于策略的算法实现:A2C,PPO,V-MPO和BC。 每种算法都支持离散(分类,伯努利,GumbelSoftmax)和连续(贝塔,正态,tanh(正态))策略分布以及矢量或图像观察环境。 Beta和tanh(Normal)在我的实验中效果最好(在BipedalWalker和Huma
2021-02-02 16:36:47
11.42MB
algorithm
reinforcement-learning
deep-learning
deep-reinforcement-learning
1
强化学习与最优控制 最新最全课件资料.zip
总共13个章节,2021最新课件!!该书的名字叫《强化学习与最优控制》,作者是美国工程院院士、麻省理工大学的Dimitri P. Bertsekas教授。本书预计将于2019年由Athena Scientific(http://www.athenasc.com/)出版社出版问世,
2021-02-02 00:04:36
19.68MB
人工智能
1
awesome-game-ai:多智能体强化学习的Awesome Game AI资料-源码
awesome-game-ai:多智能体强化学习的Awesome Game AI资料
2021-02-01 14:37:52
6KB
awesome
reinforcement-learning
ai
multi-agent
1
PARL-develop.zip
PAL是一种灵活高效的强化学习框架.具有可重复性的特点。我们给出的算法能够稳定地再现许多有影响的强化学习算法的结果。大规模的。支持数千CPU和多GPU的高性能并行训练的能力.可重复使用。存储库中提供的算法可以通过定义前向网络直接适应新任务,并自动建立训练机制。可扩展的。通过继承框架中的抽象类,快速构建新的算法。PARL is a flexible and high-efficient reinforcement learning framework.
2021-01-30 23:03:16
26.48MB
PaddlePaddle
强化学习框架
1
APS1080 LEC1.pdf
APS1080 入门级强化学习学习笔记
2021-01-29 20:17:08
3.04MB
强化学习
机器学习
人工智能
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
YOLOv5 人脸口罩图片数据集
基于MATLAB的水果图像识别
python大作业--爬虫(完美应付大作业).zip
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
DBSCAN算法Matlab实现
MTALAB NSGA2算法
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
MAC OS.X.10.8.iso 镜像文件
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
知网情感词典(HOWNET)
Vivado license 永久
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
最新下载
BABOK V3.0 官方足本 业务分析必读之一 共514页
BABOK中文版.7z
SM768集成显卡手册
Artificial Intelligence: A Modern Approach 课程课件
2023全国职业院校技能大赛-GZ019 机电一体化技术赛题10套.rar
程序员的自我修养—链接、装载与库.pdf
Cracking the Coding Interview 6th 第6版 高清完整版PDF
综合评分法投标得分计算器
Gamebryo2.6 带源码完整版(20.6.0.0b)
Y400&Y500 BIOS Back And Recovery.zip
其他资源
com.lowagie.text-2.1.7.jar下载
jsp+servlet+mysql企业人事管理系统
基于Systemview的通信系统的仿真(2ASK、2PSK、2DPSK、2FSK)
Android应用源码大学生考勤项目源码
Ncut图像分割算法MATLAB实现
allegro自动对齐工具 skill
v4版本的D3js源码和Api已经齐全的demo
Matlab批量处理图片
基于单片机的太阳能电池板自动对光跟踪系统
关闭微信个性化广告的方法
SeoClerk:使用PHP进行联盟营销的网站设计-源码
Methods fornonlinear least squares problems.pdf
遥感图像的监督分类算法贝叶斯分类器vc
lingo9破解版
JavaScript权威指南
获取多核CPU使用率,设置CPU亲和性
php人才招聘系统源码
蓝牙五子棋 安卓
Git(msysgit) 64位