强化学习 作为我的论文的最后部分,“协作多智能体学习的方法和实现”,涉及从单一智能体到多智能体的RL研究,以及协作和协作多智能体学习的最新技术。的算法和实现,在MATLAB中完成了某些RL方法的实现。 论文论文也被上传,其中包含参考文献。 单人强化学习 动态编程 蒙特卡洛方法 时差学习 线性函数逼近 深度Q网络 具有线性函数逼近的策略梯度 多智能体强化学习 集中式Q学习 滞后Q学习 多代理演员批评
2021-05-22 13:16:32 4.39MB MATLAB
1
深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法,详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理,并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后,对深度强化学习的算法和应用进行展望,针对一些未来的研究方向和研究热点给出了建议。
2021-05-21 15:18:32 2.92MB 深度强化学习 研究综述
1
线性子空间学习是较为流形的一种特征提取方法,而向量表示的子空间学习方法则是目前众多线性子空间学习方法之一.近年来人们针对这一方法的缺点和不足,提出了若干矩阵表示的子空间学习方法,这些方法都是向量表示的子空间学习方法的拓展.首先介绍了几种经典的向量表示子空间学习方法,进而对几种有代表性的矩阵表示子空间学习方法进行了综述并比较详尽地给出了这些算法的推导过程,同时对算法的有效性等问题进行了分析比较,提出了一些新的理论观点和见解.
2021-05-19 16:04:30 982KB 自然科学 论文
1
课程目录: 第一课 Spark MLlib基础入门 1、Spark介绍 2、Spark MLlib介绍 3、课程的基础环境 4、Spark RDD操作 5、RDD操作的代码实操 第二课 Spark MLlib矩阵向量 1、Spark MLlib矩阵向量 2、矩阵向量的代码实操 第三课 Spark MLlib线性回归算法 1、线性回归算法 2、源码分析 3、实例 4、实例的代码实操 第四课 Spark MLlib逻辑回归算法 1、逻辑回归算法 2、源码分析 3、实例 4、实例的代码实操 第五课 Spark MLlib贝叶斯分类算法 1、贝叶斯分类算法 2、源码分析 3、实例 4、实例的代码实操 第六课 Spark MLlib决策树算法 1、决策树算法 2、源码分析 3、实例 4、实例的代码实操 第七课 Spark MLlib KMeans聚类算法 1、KMeans聚类算法 2、源码分析 3、实例 4、实例的代码实操 第八课 Spark MLlib FPGrowth关联规则算法 1、FPGrowth关联规则算法 2、源码分析 3、实例 4、实例的代码实操 第九课 Spark MLlib协同过滤推荐算法 1、协同过滤推荐算法 2、源码分析 3、实例 4、实例的代码实操 第十课 Spark MLlib神经网络算法 1、神经网络算法 2、源码分析 3、实例 4、实例的代码实操
2021-05-18 12:02:47 71B SparkMLlib 机器学习算法 源码解析
(迁移成分分析TCA)迁移学习算法程序实现.docx
2021-05-15 22:01:24 27KB 人工智能
1
牛客网算法面试
2021-05-14 19:06:34 4.23MB 机器学习 面试
1
压缩包里有svm算法利用python实现的代码,有需要的可以下载修改参数以及数据集去运行自己的数据集模型。本代码适合学习了解svm算法,在学习过程中运行测试。
2021-05-14 15:26:38 18.32MB python svm 机器学习 算法
1
MachineLearning 一些常见的机器学习算法的实现代码,本人学习过程中做的总结,资历尚浅,如有错误请不吝指出。
2021-05-10 18:06:25 8.16MB AI
1
机器学习资源
2021-05-06 19:02:33 38.51MB 机器学习
1
强化学习 Q学习算法matlab实现 多智能体模拟仿真 算法基本思路概括,引导。强化学习的q学习算法,能够通过此算法,使得某种动作不断得到加强,希望对那些想使用Q学习算法的人有所帮助
2021-05-06 00:15:27 2KB Q—learing
1