K-Means和K-Means++算法的数据集。包含了两个特征的数据集,分别为XOY坐标轴中的X坐标和Y坐标。不带有类别标签。
2021-11-10 14:15:13 1KB 数据集
1
Users_Clustering 根据用户的行为模型,使用k-means算法对用户进行聚类
2021-11-09 18:57:29 21KB Python
1
k-means聚类算法 k-means是发现给定数据集的k个簇的算法,也就是将数据集聚合为k类的算法。 算法过程如下: 1)从N个文档随机选取K个文档作为质心 2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类,我们一般取欧几里得距离 3)重新计算已经得到的各个类的质心 4)迭代步骤(2)、(3)直至新的质心与原质心相等或迭代次数大于指定阈值,算法结束 算法实现 随机初始化k个质心,用dict保存质心的值以及被聚类到该簇中的所有data。 def initCent(dataSet , k): N = shape(dataSet)[1] cents = {} ran
2021-10-29 10:10:10 73KB k-means k-means算法 mean
1
附带了150个4维数据,300个9维数据,68040个9维和16维数据,以文件的方式输出结果。
2021-10-28 15:24:49 6.2MB K_MEANS 多维数据
1
聚类是用于提取有用信息的最重要的数据挖掘技术之一来自微阵列数据。 微阵列数据集可以按样品或基因聚类。 在这研究我们专注于基因聚类问题。 基因聚类的目的是将基因分组相似的表达模式以及共同的信念,即这些基因通常具有相似的功能, 参与特定途径或对共同环境刺激的React。 虽然数百聚类算法存在,非常简单的 K-means 及其变体仍然是最广泛的生物学家和从业者使用的基因聚类算法。 这个令人惊讶的事实可能归因于其特别易于实施和使用。 当微阵列数据归一化为零均值和单位范数时,使用归一化数据的 K 均值算法的变体将更合适。 由于数据点位于单位超球面上,因此该算法称为球面 K 均值算法 (SPK-means)。
2021-10-25 14:33:09 3KB matlab
1
实现了把n个二维向量聚类,聚成m个部分,仅供参考。
2021-10-21 18:38:17 3KB K-means
1
给出了一个利用K-means算法进行迭代聚类,并以聚类结果建立彩色图像调色板的算法C该算法在统计图像中各种颜色的RGB组合值出现次数的基础上,以聚类得到的256种颜色建立调色板,从而将BMP格式图像转换成GIF格式。实验表明,这种转换的色彩失真较小。
2021-10-18 18:34:39 2.09MB 自然科学 论文
1
基于Matlab实现: 模式识别 改进的K-Means++算法 实现模式分类
2021-10-15 15:08:25 1KB 模式识别 matab K-Mean K-Mean
1
用于聚类多元数据的 k-means++ 算法的有效实现。 已经表明,该算法具有对 log(k) 竞争的总簇内距离的期望值的上限。 此外,k-means++ 通常比普通 k-means 收敛得多。
2021-10-15 11:41:59 2KB matlab
1
1 K-means算法 实际上,无论是从算法思想,还是具体实现上,K-means算法是一种很简单的算法。它属于无监督分类,通过按照一定的方式度量样本之间的相似度,通过迭代更新聚类中心,当聚类中心不再移动或移动差值小于阈值时,则就样本分为不同的类别。 1.1 算法思路 随机选取聚类中心 根据当前聚类中心,利用选定的度量方式,分类所有样本点 计算当前每一类的样本点的均值,作为下一次迭代的聚类中心 计算下一次迭代的聚类中心与当前聚类中心的差距 如4中的差距小于给定迭代阈值时,迭代结束。反之,至2继续下一次迭代 1.2 度量方式 根据聚类中心,将所有样本点分为最相似的类别。这需
2021-10-06 23:53:46 205KB input k-means k-means算法
1