针对海量数据背景下K-means聚类结果不稳定和收敛速度较慢的问题,提出了基于MapReduce框架下的K-means改进算法。首先,为了能获得K-means聚类的初始簇数,利用凝聚层次聚类法对数据集进行聚类,并用轮廓系数对聚类结果进行初步评价,将获得数据集的簇数作为K-means算法的初始簇中心进行聚类;其次,为了能适应于海量数据的聚类挖掘,将改进的K-means算法部署在MapReduce框架上进行运算。实验结果表明,在单机性能上,该方法具有较高的准确率和召回率,同时也具有较强的聚类稳定性;在集群性能上,也具有较好的加速比和运行速度。
1
主要是基于蚁群聚类算法的一些实现,比较详细的描述的蚁群算法的基本原理
2024-06-08 10:54:47 426KB
1
模糊 C 均值聚类(FCM),即众所周知的模糊 ISODATA,是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法。 1973 年, Bezdek 提出了该算法,作为早期硬 C 均值聚类(HCM)方法的一种改进。本代码是基于matlab语言做的一个示范
2024-05-13 10:00:29 3KB
1
主要介绍了详解Java实现的k-means聚类算法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料
2024-04-27 12:01:07 685KB
1
K均值聚类即K-Means算法详解PPT
2024-04-23 17:44:06 2.06MB 聚类 kmeans
1
资源包含4个文件,其中.m和.npy为模型文件,其余两个是jupyter格式的python文件,如果没有jupyter可以用记事本或是vs code打开,再粘到py文件中运行 代码详解可见博客:https://blog.csdn.net/weixin_42486554/article/details/103732613
2024-04-23 11:16:00 375KB 支持向量机 kmeans 图像分类
1
基于K-means算法的光伏曲线聚类研究 关键词:k-means 光伏聚类 聚类 参考文档:《基于改进 K-means 聚类的风光发电场景划分》仅部分参考 仿真平台:MATLAB平台 主要内容:代码主要做的是一个光伏曲线聚类的模型,采用的是较为基础的K-means算法,经过matlab求解后,代码可以直接输出光伏原始数据集、聚类后的数据集,各类曲线的数量以及各类曲线的概率,数据显示结果非常清晰,而且求解的效果更好,店主已经对代码进行了深入的加工和处理,出图效果非常好 标题:改进 K-means 算法在光伏曲线聚类研究中的应用 关键词:K-means 算法、光伏聚类、数据分析、MATLAB平台 参考文档:《基于改进 K-means 聚类的风光发电场景划分》(部分参考) 简介: 本研究聚焦于光伏曲线聚类的模型,采用了改进后的 K-means 算法,以提高聚类的准确性。我们选择了MATLAB平台作为仿真平台,并基于该平台进行实验和数据处理。通过运用改进后的算法,我们的代码能直接输出光伏原始数据集和聚类后的数据集,同时提供各类曲线的数量和概率。结果显示数据清晰可见,求解效果更佳
2024-04-11 09:40:42 1.26MB kmeans matlab 聚类
1
使用MATLAB手打k-means聚类函数,通过矩阵运算提高运行速度,带有详细注释。 样本点归类过程提供循环方式和矩阵计算方式,后者耗时和pdist2函数相近。 矩阵运算加速后,该函数聚类速度与MATLAB自带聚类函数相当甚至更快。 压缩包中附带K-means聚类实现原理介绍及收敛性分析文件(readme.pdf)。
2024-02-03 16:31:01 659KB MATLAB k-means 矩阵运算加速 收敛性分析
1
利用谱聚类算法,根据节点间的电气距离,对电力系统进行分区
2024-01-20 09:33:04 1KB 谱聚类算法