多种寻优算法组合,包括CMA-ES、PSO、GA 等算法
2022-04-15 13:17:27 1.7MB elasticsearch 算法 大数据 big
1
涉及数学相关的一些算法模型,特别适用于学习大数据算法的同学们
2022-02-09 21:09:47 15.88MB 算法、大数据
1
4.K-最近邻(KNN)分类并行化算法 基本算法设计思想 K-最近邻是分类器算法中最通俗易懂的一种,计算测试样本到各训练样本的距离,取其中距离最小的K个,并根据这K个训练样本的标记进行投票得到测试样本的标记。 加权K-最近邻分类算法的思路是,在根据测试样本的标记进行投票表决时,将根据测试样本与每个训练样本间距离(或相似度)的大小决定训练样本标记的作用大小,基本原则是:距离越近的训练样本其标记的作用权重越大,反之则越小。据此,可以建立一个带加权的投票表决计算模型(比如y’ = ∑Si*yi/∑Si, k=[0,k-1],Si为取值0-1的相似度数值,yi为选取出的最邻近训练样本的分类标记值)决定以最终的测试样本的分类标记。 算法的思路清晰简单,然而对于海量数据计算量很大,耗费时间较长。
2021-12-25 13:22:33 24.75MB 大数据
1
在人工智能领域,贝叶斯方法是一种非常具有代表性的不确定性知识表示和推理方法。
2021-11-03 21:02:49 5.33MB 朴素贝叶斯算法 大数据
1
阿里算法大数据宝藏书 第2版-附源码
2021-10-14 15:58:32 364.61MB #资源达人分享计划
1
文章介绍了机器学习十大算法的每个算法的核心思想、工作原理、适用 情况及优缺点等
2021-09-30 09:33:30 262KB 机器学习 算法 大数据
1
随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题.文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状.此外,并行是处理大数据的主流方法,因此介绍一些并行算法,并引出大数据环境下机器学习研究所面临的问题.最后指出大数据机器学习的研究趋势.
1
超大规模用户数据挖掘和推荐算法 最新进展 (1)数据规模、挑战; (2)KDD-CUP 2012; (3)KDD-CUP 2012 Solution 剖析; (4)数据挖掘和推荐的新趋势;
内含数据集。只需运行Plot.py即可。
2021-07-25 22:06:07 5KB python kmeans算法 大数据
内含数据集。执行main.py即可
2021-07-25 22:06:06 3KB python pagerank算法 大数据