K-means聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
1
实现算法有KNN、Kmeans、EM、Perceptron、决策树、逻辑回归、svm、adaboost、朴素贝叶斯
2022-06-02 17:10:48 2.43MB knn kmeans em dt
1
K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。 使用场景:通用聚类方法,用于均匀的簇大小,簇的数量不多的情况。
2022-06-02 15:16:29 3KB KMeans 聚类 python
1
互联网搜索引擎课设二部分
2022-05-31 19:08:46 488KB kmeans算法
K-means算法数据
2022-05-31 09:11:37 28KB kmeans 算法 源码软件 机器学习
1
1、概述 本篇博文为数据挖掘算法系列的第一篇。现在对于Kmeans算法进行简单的介绍,Kmeans算法是属于无监督的学习的算法,并且是最基本、最简单的一种基于距离的聚类算法。 下面简单说一下Kmeans算法的步骤: 选随机选取K的簇中心(注意这个K是自己选择的) 计算每个数据点离这K个簇中心的距离,然后将这个点划分到距离最小的簇中 重新计算簇中心,即将每个簇的所有数据点相加求均值,将这个均值作为对应簇的新簇中心。 重复2、3步,直到满足了你设置的停止算法迭代的条件 注意:停止算法迭代的条件一般有三个: 没有(或最小数目)对象被重新分配给不同的聚类。 没有(或最小数目)聚类中心再发生变化。 误差
2022-05-31 00:43:12 142KB mean ns 算法
1
该资源主要参考我的博客: [python] Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像 http://blog.csdn.net/eastmount/article/details/50545937 包括输入文档txt,共1000行数据,每行都是分词完的文本。 本文主要讲述以下几点: 1.通过scikit-learn计算文本内容的tfidf并构造N*M矩阵(N个文档 M个特征词); 2.调用scikit-learn中的K-means进行文本聚类; 3.使用PAC进行降维处理,每行文本表示成两维数据;
2022-05-30 23:14:11 358KB python Kmeans PAC降维 Matplotlib
四 基于kmeans聚类分割+图像处理的结果
2022-05-29 14:05:27 122KB matlab
实验 Spark ML Bisecting k-means聚类算法使用,实验文档
2022-05-26 14:39:08 30KB spark ml kmeans
1
一种改进的 k-means 算法1(word原稿可复制可编辑).doc
2022-05-25 19:06:44 100KB kmeans 算法 文档资料 机器学习