只为小站
首页
域名查询
文件下载
登录
深度强化学习入门详细资料
内容包含Easy-RL的200页PDF,入门深度强化学习170页PPT,lecture-alphastar76页PDF.
2021-05-28 21:05:37
107.87MB
RL
DRL
强化学习
深度强化学习
1
TrainMultipleAgentsToPerformCollaborativeTaskExample.zip
MATLAB强化学习实战(八) 训练多个智能体执行协作任务 代码
2021-05-25 21:01:46
486KB
matlab
多智能体强化学习
1
强化学习qlearning算法训练贪吃蛇
利用qlearing算法训练贪吃蛇,模型在2000次循环内取得很好的效果,属于伯克利人工智能导论课cs188中的作业
2021-05-24 14:34:28
5KB
强化学习
人工智能
贪吃蛇
Q-learning
1
reinforcement_learning-master.zip
强化学习项目
2021-05-23 22:06:27
48KB
强化学习
1
强化学习matlab代码
强化学习算法,实现强化学习对网络资源的分配,目的是频谱利用最大化 强化学习算法,实现强化学习对网络资源的分配,目的是频谱利用最大化
2021-05-22 16:44:45
2KB
强化学习算法
1
reinforcement-learning:单智能体和多智能体强化学习算法的实现。 的MATLAB-源码
强化学习 作为我的论文的最后部分,“协作多智能体学习的方法和实现”,涉及从单一智能体到多智能体的RL研究,以及协作和协作多智能体学习的最新技术。的算法和实现,在MATLAB中完成了某些RL方法的实现。 论文论文也被上传,其中包含参考文献。 单人强化学习 动态编程 蒙特卡洛方法 时差学习 线性函数逼近 深度Q网络 具有线性函数逼近的策略梯度 多智能体强化学习 集中式Q学习 滞后Q学习 多代理演员批评
2021-05-22 13:16:32
4.39MB
MATLAB
1
深度强化学习算法与应用研究现状综述
深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法,详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理,并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后,对深度强化学习的算法和应用进行展望,针对一些未来的研究方向和研究热点给出了建议。
2021-05-21 15:18:32
2.92MB
深度强化学习
研究综述
1
最近关于 毕设使用的文章介绍.docx
就是尝试下第一次可以成功吗?
2021-05-20 09:04:33
166KB
强化学习
车辆
1
开源Java.emmx
Java入门思维导图
2021-05-17 18:05:00
20KB
强化学习
1
基于深度强化学习控制的节能热模拟加热系统设计.rar
基于深度强化学习控制的节能热模拟加热系统设计
2021-05-13 20:02:48
6.42MB
强化学习
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
基于蒙特卡洛生成电动汽车充电负荷曲线程序
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
大学生网页设计大作业-5个网页设计制作作品自己任选
基于yolov4-keras的抽烟检测(源码+数据集)
scratch版 我的世界.sb2
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
多目标优化算法(四)NSGA3的代码(python3.6)
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
狂神说Java系列笔记.rar
IEEE ENDNOTE 模板【更新】
商用密码应用与安全性评估——霍炜.pdf
上帝之眼和拾荒者.rar
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
Plex v7.12电视端app
quartus II13.0器件库.zip
最新下载
小波阈值MATLAB代码,可以实现软阈值、硬阈值以及5种改进阈值方法,封装好的函数快速实现
2022年电赛A题:单相交流电子负载 单相pwm整流 基于stm32f407vet6的单相DQ锁相环
9218-9217B增加强刷.救砖模式增量单刷脚本(内有说明).7z
ckeditor_4.14.1_full
掌讯方案9218、9217B、9217升级说明及工具(电脑升级不要勾选Preloader).rar
KT and KP(xTouch_2015-05-15.36515.rtm).zip
owncloud 8.0.16
散度、旋度、梯度释义(图解版)—(美)H.M.斯彻 著 李维伟等译 2015.11出版
FME2015破解版+汉化包
CESP一级集训课PPT第三课
其他资源
基于Python开发的学生信息管理系统源码
51单片机最小系统详解电路图
websocket C++ Server端简单demo
Visio 2010简体中文64位(百度网盘下载地址)
Fluent 中文帮助文档(1-28章)完整版 精心整理
多车场多车型车辆路径问题的改进遗传算法
基于单片机AT89C52的温控系统.zip
60多套html5移动端模板
通信原理_樊昌信 第五版
.net 后台Post,get方式调用webapi
instantclient-basic-windows.x64-12.1.0.1.0
Java Swing俄罗斯方块-含完整源码
校园无线网络规划与设计
任意次多项式曲线拟合(Delphi类)
不确定离散时间随机系统的优雅防干扰控制
Xilinx.CPLD源码参考设计.7z
2017年10月高等教育自学考试全国统一命题考试数据结构导论试卷及答案.docx
票务系统架构设计案例分析
E6400-Mac10.8.4完美驱动
用matlab研究光栅衍射
Html5愤怒的小鸟源码
自适应纯静态HTML商城模板
An Introduction to the Analysis of Algorithms 2nd PDF
discuz 超级工单系统 主程序1.2.1含手机触屏版1.0
很全的PCB 封装库 AD版本 下载
二叉树三种遍历的非递归算法(背诵版)