马尔可夫决策过程 概述 该存储库运行3种强化算法:策略迭代,值迭代和Q学习,以解决2个MDP问题:悬崖行走和20X20冻湖网格,并比较它们的性能。 运行步骤 需要Python 3.6 使用pip从Requirements.txt安装需求 使用python 3运行以下命令以创建数据和图形文件: python run_experiment.py-全部 python run_experiment.py --plot 获得的结果 有关获得的结果的更多信息,请参考Analysis.pdf。 悬崖行走问题 问题 结果 冻湖网格问题 问题 结果
2021-03-03 17:16:25 3.63MB Python
1
基于特征联合概率分布和实例的迁移学习算法
2021-03-02 16:07:18 340KB 研究论文
1
TheSparksFoundation_Task-4_Decision-Trees 决策树是用于分析数据的图形表示。 决策树以这种方式为我们提供数据,我们可以轻松地读取,理解和分析数据。 决策树算法属于监督学习算法家族。 ...使用决策树的目的是创建一个训练模型,该模型可以通过学习从先前数据(训练数据)推断出的简单决策规则来预测目标变量的类或值
2021-03-02 13:05:40 3KB Python
1
Tensorflow implementations of various Learning to Rank (LTR) algorithms.
2021-02-28 21:53:12 3.68MB Python开发-机器学习
1
知识表示相关学习算法
2021-02-28 19:08:14 38KB 知识表示
1
基于Q学习算法和遗传算法的动态环境路径规划
2021-02-26 18:07:55 856KB 研究论文
1
基于改进机器学习算法的电商用户购买预测,胡智超,杨福兴,近年来,电商平台陡增的巨额订单量容易导致快递爆仓,也极大地超过了物流系统的运载能力。本文采用现有的数据挖掘技术分析用户的
2021-02-26 17:34:06 298KB 首发论文
1
基于MAB的两层学习算法,用于随机水下声通信网络中的联合信道和功率分配
2021-02-26 17:04:44 1.02MB 研究论文
1
探索几种用于面部识别和分类的机器学习算法! :) 查看Jupyter Notebook和Figures了解更多详细信息(我保证您不会失望)
2021-02-26 11:05:30 2.27MB JupyterNotebook
1
字典学习(DL)方法近年来被广泛应用于解决各种计算机视觉领域的问题。现有的大部分字典学习算法均旨在学习一个综合型字典来表示输入信号,并使表示系数或表示误差具有一定的判别能力。这些字典学习算法大都需要对稀疏表示系数采用l0或者l1范数的约束,所以学习过程比较耗时。解析型字典学习的提出较为有效地解决了字典学习算法效率低的问题。在分类识别任务中,联合学习一个综合型字典和一个解析型字典正在成为一个热门的研究趋势,这不仅很大程度上降低了学习过程中的计算复杂度,而且在分类识别性能上也能有一定的提升。本文借鉴了最新提出的“字典对”学习思想,利用训练数据的局部结构信息,提出了局部保持的综合型-解析型“字典对”学习算法。在三个国际公开测试数据库(人脸识别库Extended YaleB、AR和图像分类库Caltech101)上的实验结果表明,局部保持的综合型-解析型“字典对”学习算法在准确率和效率方面都具有很好的性能。
1