k-means聚类算法及matlab代码目录
介绍
K-均值聚类是一种简单且可扩展的聚类方法,它以一种客观的方式将观察结果划分为k个聚类。
它具有非常广泛的应用,例如图像分割,零售产品分类(Kusrini,2015),温室气体排放等环境问题(Kijewska和Bluszcz,2015)。
K均值聚类可以与其他高级方法结合使用。
例如,它与支持向量机(SVM)一起使用来执行自动文本分类(Perrone和Connell,2000年)。
它也可以用作预处理方法,例如在隐马尔可夫模型(HMM)中初始化(Hu和Zanibbi,2011年)。
它的广泛应用和简单的计算复杂度使k-means聚类成为当今流行的方法之一。
当维数d>
1且簇数k>
1时,找到k均值成本函数的最小值是一个NP难题。
科学家想出了几种启发式方法来找到局部最小值,但是该过程仍然需要大量计算,尤其是对于具有高维特征的大型数据集而言。
因此,我们希望在机器集群上实现k-means启发式方法的并行版本,以在不牺牲算法准确性的情况下显着加快算法的运行速度。
k均值聚类的典型方法是期望最大化(EM)。
E步将点分配到最近的聚类中心,而
2021-12-18 20:06:11
54.51MB
系统开源
1