针对用电数据量大、用电数据挖掘效率低等问题,采用理论分析和实验的方法,进行用电数据并行分析构架的研究,研究了Canopy和K-means两种典型的聚类算法,提出一种新的聚类思路,使用Canopy先对用电数据进行粗略处理,得到聚类个数和聚类中心,再用K-means精确聚类,既利用了K-means算法简单、收敛速度快的优势,又使其不容易陷入局部最优.为达到处理海量数据的目的,把提出的算法部署到MapReduce框架上进行实验.研究结果表明:提出的算法在海量用电数据的处理方面高效可行,并且具有良好的加速比.
1
KMeans算法和Elbow准则 “ k-Means聚类背后的想法是获取一堆数据并确定数据中是否存在任何自然聚类(相关对象的组)。 k-Means算法是所谓的无监督学习算法。 我们事先不知道数据中存在什么模式-它没有形式分类-但我们想知道是否可以将数据以某种方式分为几类。 例如,您可以使用k-Means通过告诉像素根据其颜色值将像素分组为3个群集来查找图像中3种最突出的颜色。 或者,您可以使用它将相关新闻文章分组在一起,而无需事先确定要使用的类别。 该算法将自动找出最佳组。 k均值中的“ k”是一个数字。 该算法假定数据中存在k个中心,各个数据元素分散在周围。 最接近这些所谓质心的数据将被分类或分组在一起。 k-Means不会告诉您每个特定数据组的分类器是什么。 将新闻文章分成几组后,并不能说第一组是关于科学的,第二组是关于名人的,第三组是关于即将举行的选举的,等等。您只知道相关的新闻故事现在在一起了,但不一定是什么这种关系意味着。 k均值仅有助于寻找潜在的集群。” -取自对算法的移植。 存储库包含: 将的模型拟合到。 使用“肘标准”为K-means算法确定最佳聚类数的
2021-04-11 10:21:11 100KB python machine-learning scikit-learn sklearn
1
主要介绍了Spark实现K-Means算法代码示例,简单介绍了K-Means算法及其原理,然后通过具体实例向大家展示了用spark实现K-Means算法,需要的朋友可以参考下。
2021-04-09 14:48:59 53KB spark k-means 算法
1
用K-Means算法 K-Harmonic Means算法分别对平面上的点集进行聚类 并对结果进行比较
2021-04-07 12:32:13 5.54MB 毕业设计 聚类 K-Means K-Harmonic
1
K-means算法 MATLAB程序可以直接运行,有助于初学者的学习使用
2021-04-07 09:45:16 1KB k-means
1
当初打数学建模的时候,在网上找了一堆东西。翻出来了这个,现在放到网上,供大家一起学习,没办法最低就1个积分了。欢迎大家一起学习!
2021-04-05 10:31:57 980KB Matlab
1
用于K-means算法的数据集,当让你聚类完后也可以逻辑回归或者线性回归。
2021-04-02 22:29:15 39KB K-means
1
k-means算法详解,内含k-means算法基于mapreduce的实现
2021-04-02 16:12:10 380KB k-means
1
0 前言 K-Means是聚类算法的一种,通过距离来判断数据点间的相似度并据此对数据进行聚类。 1 聚类算法 科学计算中的聚类方法 方法名称 参数 可伸缩性 用例 几何形状(使用的指标) K-Means number of clusters Very large , medium with MiniBatch coden_samplesn_clusters General-purpose, even cluster size, flat geometry, not too many clusters Distances between poi
2021-03-28 12:35:29 95KB k-means k-means算法 mean
1
为满足基于Kinecrt的康复训练系统的需要,提出一种人体动作匹配和评估方法。该方法通过Kinect实时提取骨骼关节点三维坐标,计算骨骼关节点的角度,得到一组动作序列的空间角度变化值;然后通过改进的DTW算法把两组动作序列的角度值进行匹配,得到两个序列之间的距离;最后通过K-means聚类方法对距离的大小评估。实验表明,该方法能很好地实现人体动作匹配和评估,实时性好,较传统DTW算法在识别速率上有明显提高。
2021-03-27 18:29:59 238KB 动作匹配
1