1、概述
本篇博文为数据挖掘算法系列的第一篇。现在对于Kmeans算法进行简单的介绍,Kmeans算法是属于无监督的学习的算法,并且是最基本、最简单的一种基于距离的聚类算法。
下面简单说一下Kmeans算法的步骤:
选随机选取K的簇中心(注意这个K是自己选择的)
计算每个数据点离这K个簇中心的距离,然后将这个点划分到距离最小的簇中
重新计算簇中心,即将每个簇的所有数据点相加求均值,将这个均值作为对应簇的新簇中心。
重复2、3步,直到满足了你设置的停止算法迭代的条件
注意:停止算法迭代的条件一般有三个:
没有(或最小数目)对象被重新分配给不同的聚类。
没有(或最小数目)聚类中心再发生变化。
误差
1