这里面是机器学习里面聚类所需的数据集,分为人工的二维数据集,如月牙形,双螺旋型等,和UCI真实数据集,是我搜集好久才弄出来的,有一些二维数据集是自己生成的,提供给大家做算法实验。
2021-12-14 00:43:12 2.44MB 聚类数据集
1
本实验利用两类数据:模拟数据与真实数据。模拟数据有著名复杂网络学者Mark Newmann所提出,该网络包括128个节点,每个节点的度为16,网络包含4个社团结构,每个社团包含32个节点,每个节点与社团内部节点有k1个节点相互链接,与社团外部有k2个节点相互链接 (k1+k2=16)。通过调节参数k2 (k2=1,2,3,4,5,6,7,8)增加社团构建检测难度。http://www-personal.umich.edu/~mejn/ 真实数据集:跆拳道俱乐部数据由34个节点组成,由于管理上的分歧,俱乐部分解成两个社团。 包括代码和文档
2021-12-05 20:51:08 569KB 聚类 数据挖掘
1
可用于对SPSS的分析,希望可以帮到大家。案例中包括了详细的分析数据。
2021-11-28 16:30:33 1KB SPSS
1
层次聚类方法的改进--BIRCH BIRCH(利用层次方法的平衡迭代归约和聚类)是一个综合的层次聚类方法,它用聚类特征和聚类特征树(CF)来概括聚类描述。该算法通过聚类特征可以方便地进行中心、半径、直径及类内、类间距离的运算。CF树是一个具有两个参数分支因子B和阂值T的高度平衡树,存储了层次聚类的聚类特征。分支因子定义了每个非叶节点孩子的最大数目,而阈值给出了存储在树的叶子节点中的子聚类的最大直径。 BIRCH算法的工作过程包括两个阶段: 阶段一:BIRCH扫描数据库,建立一个初始存放于内存的CF树,它可以被看作数据的多层压缩,试图保留数据内在的聚类结构。随着对象的插入,CF树被动态地构造,不要求所有的数据读入内存,而可在外存上逐个读入数据项。因此,BIRTH方法对增量或动态聚类也非常有效。 阶段二:BIRCH采用某个聚类算法对CF树的叶结点进行聚类。在这个阶段可以执行任何聚类算法,例如典型的划分方法。 BIRCH算法试图利用可用的资源来生成最好的聚类结果。通过一次扫描就可以进行较好的聚类,故该算法的计算复杂度是O(n),n是对象的数目。
2021-11-11 18:21:48 598KB 聚类 数据挖掘 伪代码 例子
1
two_cluster、three_cluster、five_cluster为不同簇数的点集,适用于Kmeans聚类 spiral、Twomoons、ThreeCircles分别为螺旋分布、月牙分布、环形分布数据集。
2021-11-01 19:36:54 355KB 聚类、数据
1
聚类常用数据集
2021-10-24 00:17:24 32KB 聚类数据集
1
Martinez, Martinez, Solka, Exploratory Data Analysis with MATLAB, 2ed, CRC, 2011。英文版探索性数据分析,使用Matlab实现。体系较完整的介绍了数据降维,数据聚类以及数据可视化的经典方法,其中不少一些新近发展起来的方法。
2021-10-07 22:50:56 6.43MB 数据降维 数据聚类 数据可视化
1
从零开始学Python--数据分析与挖掘
2021-10-04 22:55:35 11KB 数据挖掘、聚类数据
1
机器学习里面聚类所需的数据集,分为人工的二维数据集,如月牙形,双螺旋型等,和UCI真实数据集
机器学习里面聚类所需的数据集,分为人工的二维数据集,如月牙形,双螺旋型等,和UCI真实数据集