案例数据集《多元统计分析-聚类分析-层次聚类
2024-01-15 11:19:06 14KB 数据集 聚类
1
数据挖掘实战聚类分析的资源,包括城市消费因素的数据集和k-means,k-medoids,层次聚类,Som四种聚类分析算法的代码。
1
使用 PHA 方法执行快速层次聚类。 该函数将从输入距离矩阵生成层次聚类树 (Z)。 输出 Z 类似于 Matlab 函数“linkage”的输出。 [主要特征] 1.比matlab联动功能更快。 2. 对混合正态分布的集群具有出色的性能。 3. 生成系统发育树的理想工具。 [参考] 永岗路,易湾。 (2013)。 “PHA:基于快速势的分层凝聚聚类方法,”模式识别,卷。 46(5),第 1227-1239 页。
2023-01-05 14:37:23 2KB matlab
1
K均值的时间复杂度为NKTD,其中,N代表样本个数,K代表k值,即聚类中心点个数,T代表循环次数,D代表样本数据的维度。 本算法的改进主要在以下方面: 一, 初始聚类中心点,传统的初始中心点是随机选择,由于K均值算法受初始中心点影响较大,为获得更好的效果,在本方法中,先将数据采用层次聚类的方法预处理,得到的k个中心点作为K均值算法的中心点。 二, 传统的聚类中心点更新是在结束一次循环后,本方法的聚类中心采用实时更新策略,即每次将一个模式归于一个新的聚类中心时,即立刻更新新的所属中心和原属聚类中心的中心值,增强算法的收敛性。 三, 为达到类内方差最小化,类类方差最大化这一原则,考虑到往往设定的K值不一定能很好实现聚类效果,故将以往的固定聚类中心改为一浮动区间。原有K为最小聚类中心个数,另设一聚类中心个数上限maxK。其具体实现如下: 1) 当一待聚类的模式得到其最近中心时,计算该聚类中心类内方差和将此模式归于该中心之后的类内方差,如果两者差别大于某设定阈值,则以该模式数据为基础,得到一新的聚类中心。 2) 当当前聚类中心个数等于设定的最大聚类中心时,合并最相邻的两个聚类。为使得到的聚类效果更为均衡,应该优先合并维度较小的聚类类别。
2022-12-19 08:49:27 1.85MB 层次聚类 K均值 不定K
1
包括最长、最短欧式距离法、重心法(标准欧式、平方欧式、精度加权)、平均法、权重法等等
Chameleon:使用动态建模的多阶段层次聚类.pdf 学习资料 复习资料 教学资源
2022-07-10 14:05:09 274KB 计算机
matlab 层次聚类算法的两种方法 用于多元统计分析 1.层次聚类 hierarchical clustering 2.k-means聚类
2022-06-11 15:32:04 4KB 多元统计 层次 聚类 K-means聚类
1
CHAMELEON A Hierarchical Clustering Algorithm :变色龙的层次聚类算法.ppt
2022-05-29 14:07:03 332KB 算法 聚类 数据结构 数据挖掘
变色龙一个利用动态模型的层次聚类算法.ppt
2022-05-26 09:10:22 1.75MB 算法 聚类 文档资料 数据结构