主要介绍了python 代码实现k-means聚类分析(不使用现成聚类库),本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
1
本资源包括 线性回归,Logistic回归和一般回归,K-means聚类分析,独立分析,线性判别分析,增强学习,还有混合高斯模型和EM算法的的学习笔记,往后还有更新。
2021-12-23 02:17:43 4.08MB 线性回归 K-means聚类
1
K-means聚类算法 简介 聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类就是一种发现这种内在结构的技术,聚类技术经常被称为无监督学习。 K均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目k,k由用户指定,k均值算法根据某个距离函数反复把数据分入k个聚类中。 算法 先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算
2021-12-22 20:07:13 84KB ab atl b函数
1
使用K均值的客户细分 使用K-Means聚类算法根据新近度,频率和货币价值(RFM)指标对客户进行细分
2021-12-22 12:59:42 1.5MB JupyterNotebook
1
som matlab代码K均值聚类 Matlab中的K均值聚类算法在本节中,目的是在Matlab中使用聚类算法,并发现自组织图(SOM)神经网络如何将虹膜花朵拓扑分类成类,从而提供对花朵类型的深入了解和有用的工具进行进一步分析。 自组织图神经网络可以将鸢尾花按拓扑分类成类,从而提供对花朵类型的深入了解以及进一步分析的有用工具。 SOM是(1)竞争性学习人工神经网络(ANN)(2)地图的每个单元都减少相同的输入。 (3)单元竞争选择(4)修改所选节点及其邻居。 文件中包含用于检测人脸的matlab代码。
2021-12-21 20:03:02 2.76MB 系统开源
1
kMeans_PCA 在sklearn乳腺癌数据集上包含k-Means和PCA的原始代码
2021-12-21 14:00:30 97KB JupyterNotebook
1
数据挖掘导论小结
2021-12-21 10:02:24 21KB K-Means kdd 决策树 神经网络
1
R中的均值漂移聚类算法 在Iris数据库中应用均值漂移模型(msClustering),使用绘图库以图形方式显示此算法中生成的聚类。 与Kmeans(K平均值)不同,我们没有定义聚类的数量,该算法处理这种分类。
2021-12-20 20:23:52 2KB
1
C++ 版的K_means 源代码,分类效果很好,
2021-12-20 16:00:06 15KB C++ k_means 代码
1
k-means聚类算法及matlab代码目录 介绍 K-均值聚类是一种简单且可扩展的聚类方法,它以一种客观的方式将观察结果划分为k个聚类。 它具有非常广泛的应用,例如图像分割,零售产品分类(Kusrini,2015),温室气体排放等环境问题(Kijewska和Bluszcz,2015)。 K均值聚类可以与其他高级方法结合使用。 例如,它与支持向量机(SVM)一起使用来执行自动文本分类(Perrone和Connell,2000年)。 它也可以用作预处理方法,例如在隐马尔可夫模型(HMM)中初始化(Hu和Zanibbi,2011年)。 它的广泛应用和简单的计算复杂度使k-means聚类成为当今流行的方法之一。 当维数d> 1且簇数k> 1时,找到k均值成本函数的最小值是一个NP难题。 科学家想出了几种启发式方法来找到局部最小值,但是该过程仍然需要大量计算,尤其是对于具有高维特征的大型数据集而言。 因此,我们希望在机器集群上实现k-means启发式方法的并行版本,以在不牺牲算法准确性的情况下显着加快算法的运行速度。 k均值聚类的典型方法是期望最大化(EM)。 E步将点分配到最近的聚类中心,而
2021-12-18 20:06:11 54.51MB 系统开源
1