K均值算法使用聚类的准则函数是误差平方和准则,通过反复迭代优化聚类结果,使得所有样本到各自所属类别的中心的距离平方和达到最小【10】。该算法的特点是选一批代表点(初始聚类中心)后,计算所有样本到聚类中心的距离,将所有样本按最小距离原则划分类别,形成初始分类,再重新计算各聚类中心,这是引种批处理方法。另一种方法是逐个处理法,每读入一个样本就把它归于距离最近的一类,形成新的分类并计算新的聚类中心,然后再读入下一个样本归类,即每个样本的归类都改变一次聚类中心。
2021-11-04 11:23:21
7KB
K均值
1