只为小站
首页
域名查询
文件下载
登录
TrainMultipleAgentsForAreaCoverageExample.zip
MATLAB强化学习实战(九) 多智能体的区域探索 源码
2021-05-06 12:09:05
3.53MB
强化学习
1
知识图谱中的深度学习.pdf
对知识图谱感兴趣的朋友。内容包括1知识图谱的起源和概念2知识图谱的应用场景3知识图谱的构建方法4知识图谱的技术基础5从知识图谱到认知图谱6在图上轻松学习深度学习:DGL(DEEP GRAPH LIBRARY)中使用TensorFlow的案例
2021-05-04 14:07:26
2.79MB
知识图谱
强化学习
基于强化学习的井字棋
语言是用python,窗体基于tkinter,算法基于强化学习,采用最简单的qLearing 基本思想参考博客https://blog.csdn.net/JerryLife/article/details/81385766 注释编码是gbk,若编码乱码,注意更改编码格式
2021-05-02 19:07:51
9KB
强化学习
井字棋
1
David Silver强化学习课程(2-9)思维导图整理.zip
文档是根据David Silver 强化学习课件和视频整理的思维导图,包含了第二到第九讲的内容,不是很全面,请大家见谅。 在整理过程中参考了https://blog.csdn.net/xyk_hust和https://me.csdn.net/dukuku5038的学习心得。 (思维导图软件是用的Xmind试用版)
2021-05-01 22:33:49
2.77MB
强化学习
思维导图
1
强化学习简单实现(C++)
强化学习简单实现 开发语言:C++ 运行环境:Ubuntu 16.06
2021-04-30 09:06:36
7KB
reinforcemen
1
强化学习sutton第二版 习题答案.rar
强化学习sutton第二版习题答案
2021-04-30 09:01:58
1.62MB
强化学习
1
DeepReinforcementLearning-DDPG-for-RoboticsControl:这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,以训练4自由度机械臂达到移动目标。 动作空间是连续的,学习的特工为机器人输出扭矩以移动到特定目标位置-源码
DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,用于训练4自由度机械臂以达到移动目标。 动作空间是连续的,学习的代理会输出扭矩以使机器人移动到特定的目标位置。 环境 一个包含20个相同代理的,每个代理都有其自己的环境副本。 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。 每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。 动作向量中的每个条目都应为-1和1之间的数字。 解决环境 您的特工平均得分必须为+30(超过100个连续剧集,并且超过所有特工)。 具体来说,在每个情节之后,我们将每个代理商获得的奖励加起来(不打折),以获得每个
2021-04-29 11:38:55
20.38MB
JupyterNotebook
1
Matlab强化学习_网格迷宫问题_SarsaLambda算法
MATLAB强化学习代码包,用于解决多步决策模型(网格迷宫问题)的Sarsa-λ算法 "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"
2021-04-28 14:50:37
2KB
matlab
机器学习
强化学习
SarsaLambda算法
1
详解强化学习当前进展及未来方向【强化学习最新综述】.zip
强化学习最新综述新鲜出炉。在这篇文章中,作者对强化学习进行了全面的研究,包括现有的挑战、不同技术的最新发展以及未来的发展方向。文章致力于提供一个清晰简单的研究框架,能够为新的研究人员或者想全面了解强化学习领域的人提供一个参考。
2021-04-28 09:38:55
437KB
RL
1
Python-tensorflow实战练习包括强化学习推荐系统nlp等
tensorflow实战练习,包括强化学习、推荐系统、nlp等
2021-04-27 21:15:46
95.11MB
Python开发-机器学习
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
IEEE ENDNOTE 模板【更新】
拾荒者.exe同时ID扫描器IP扫描器
随机森林用于分类matlab代码
EasyMedia-ui.zip
校园网规划与设计(报告和pkt文件)
Spring相关的外文文献和翻译(毕设论文必备)
银行笔试 信息科技岗部分真题
2021华为芯片研发岗位笔试题
EEMD算法应用于信号去噪.rar
西门子逻辑控制设计开发_3部10层
java-spring-web-外文文献翻译40篇.zip
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
DBSCAN算法Matlab实现
BP_PID控制仿真.rar
最新下载
小波阈值MATLAB代码,可以实现软阈值、硬阈值以及5种改进阈值方法,封装好的函数快速实现
2022年电赛A题:单相交流电子负载 单相pwm整流 基于stm32f407vet6的单相DQ锁相环
9218-9217B增加强刷.救砖模式增量单刷脚本(内有说明).7z
ckeditor_4.14.1_full
掌讯方案9218、9217B、9217升级说明及工具(电脑升级不要勾选Preloader).rar
KT and KP(xTouch_2015-05-15.36515.rtm).zip
owncloud 8.0.16
散度、旋度、梯度释义(图解版)—(美)H.M.斯彻 著 李维伟等译 2015.11出版
FME2015破解版+汉化包
CESP一级集训课PPT第三课
其他资源
p2p源码文件——仅供参考.zip
OFDM信道估计,实现了LMMSE算法
电影院网上订票系统
jl1.0.1.jar 音乐播放的包
Oracle课程设计管理系统
Tekla .NET_API 实例 + 帮助文档
An Introduction to the Finite Element Method(扫描版)
刘坚第二版编译原理答案
学生成绩管理系统(C语言)
C# VC++ BHO 源码以及教程大全
flash视频.rar
11g OCM 题库
很好用的SAR图像机场跑道边缘检测方法
The Reasoned Schemer, 2nd Edition
2019华为软件挑战赛赛区十几名 初赛复赛程序以及判题器
大学生二手交易平台1.zip
Push_Notifications_by_Tutorials_v1.0
python-2.7.14.amd64.msi
拉盖尔高斯模式
FDMA--课程设计
用C++实现简单的扫雷游戏,内含源代码和可执行文件,vs2013编写
yy开播插件.exe
vc车牌识别程序源代码
使用SQLHelper类调用带输出、返回参数的存储过程