The code of Local Gravitation Clustering, see in the paper "Clustering by Local Gravitation " http://ieeexplore.ieee.org/document/7915751 citation: Z. Wang et al., "Clustering by Local Gravitation," in IEEE Transactions on Cybernetics, vol. 48, no. 5, pp. 1383-1396, May 2018. For Chinese readers who visit this page from my dissertation: 我的毕业论文的知网CAJ格式中很多图表显示有问题, 可能的原因是知网的CAJ格式对矢量图的支持不好, 而我提交的pdf版
2023-03-02 10:08:11 5KB matlab
1
Python数据分析与机器学习-使用Kmeans进行图像压缩 Python数据分析与机器学习-使用Kmeans进行图像压缩
2023-02-27 22:18:35 16KB python
1
当提供不适当的参数或将其应用于由具有不同形状,大小和密度的聚类组成的数据集时,大多数聚类算法将变得无效。 为了缓解这些不足,我们提出了一种新颖的拆分合并层次聚类方法,其中采用最小生成树(MST)和基于MST的图来指导拆分和合并过程。 在分割过程中,选择基于MST的图中具有高度的顶点作为初始原型,并使用K均值来分割数据集。 在合并过程中,将对子组对进行过滤,并且仅考虑相邻对。 所提出的方法除了簇数以外不需要任何参数。 实验结果证明了其在合成和真实数据集上的有效性。
2023-02-25 08:54:26 1.76MB Data sets; Hierarchical clustering
1
Python 58同城房价bs4 beautiful soup爬虫获取 room_name room_type room_area room_addr0 room_addr1 room_price房价名称类型面积地址价格等 jieba中文分词 tf-idf向量化 kmeans聚类 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-02-22 22:22:27 113KB jieba NLP 爬虫 kmeans
1
nmi指数matlab代码演示快速入门 运行 demo.m。 这可以在 30 个测试数据集上为以下两种聚类方法重现图 4A 中的结果。 ND-Ward-E(KT) :2020年Pattern Recognition上发表的拟议聚类方法(标题:邱和李的“Enhancing In-Tree-based Clustering via Distance Ensemble and Kernelization”); ND-K :一种比较方法(Qiu 等人。“最近下降、树内和聚类”,arXiv:1412.5902v2,2014 年)。 注:a) ND-K 是 ND-Ward-E(KT) 的基础; b) 对于 ND.m,低版本 Matlab 中可能不存在函数“maxk”; 在这种情况下,可以使用 ND.m 中它后面的以下代码代替(我们在 ND.m 中突出显示了它)。 推荐方法介绍:ND-Ward-E(KT) 最近,我们提出了一种新的受物理启发的方法,称为最近下降(ND),它的作用是将所有样本组织成一个有效的图,称为 in-tree(图 1A)。 由于其有效的特性,这种 in-tree 证明非常适合数据
2023-02-08 17:32:39 36.53MB 系统开源
1
这个代码主要是介绍了python使用kmeans算法来对图像中的像素进行聚类。整个kmeans算法为手动实现,不调用sklearn库。一共使用了两种方法,其中方法a.py使用了三通道像素值rgb共三个特征,方法b.py使用了rgb+像素坐标xy共5个特征。
2023-02-01 15:54:08 767KB kmeans算法 机器视觉 机器学习
1
kmeans 聚类问题实例,用kmeans聚类算法将数据分成三类,实现三分类问题,并将分类结果进行储存
2023-01-14 12:19:09 2KB 机器学习
1
kmeans 分析matlab代码K均值聚类 这是K-means算法在MATLAB和Python中的简单实现 K-means 聚类是一种矢量量化方法,最初来自信号处理,在数据挖掘中流行用于聚类分析。 k-means聚类旨在将n个观测值划分为k个簇,其中每个观测值都属于具有最近均值的簇,作为簇的原型。 这导致将数据空间划分为 Voronoi 单元。 该代码实现了 K-means 算法并在一个简单的 2D 数据集上对其进行了测试。 例子 在这个例子中,我们首先从三个正态分布生成一个点数据集并标记数据集。 这个带有正确标签的数据集是我们的真实值。 然后我们重新调整标签并为新数据集运行 k-means 算法。 该算法正确地对数据集进行聚类,并估计聚类的中心。 在最后一步,我们将我们的结果与 Mathworks 实现的 k-means 的结果进行比较。 结果 我在我的机器上得到的结果如下: iteration: 1, error: 1.8122, mu1: [-0.2165 4.0360], mu2: [4.2571 0.0152], mu3: [-1.1291 -3.0925] iterati
2023-01-12 08:52:42 86KB 系统开源
1
txt文件——用制表符做为分隔符的txt文件,文件名为protein.txt。数据内容主要 描述的是欧洲蛋白质消费数据(Protein Consumption in Europe)。 Protein数据集给出了欧洲25个国家对9类食物的消费数据,由25行10列构成 每一行记录代表的是一个国家的蛋白质消费数据;
2022-12-30 16:45:26 1KB kmeans算法 机器学习
1
DNS(域名系统)在引导Internet流量方面提供了关键功能。 保护DNS服务器免受带宽攻击是DNS服务提供商的一项重要任务。 传统的基于规则的异常或入侵检测方法无法动态更新规则。 基于数据挖掘的方法能够在海量动态查询流量数据中找到各种模式。 这些模式可以帮助DNS服务提供商实时检测异常。 本文提出了一种新颖的频繁情节挖掘算法,以及一种可以实时检测异常的体积趋势预测方法。 基于查询量时间序列的特征,采用基于密度的聚类方法将多个域名划分为不同的组。 提出了一种一致的情节挖掘方法,以发现查询流量如何在不同域名之间的不同时间“传播”。 实验是对实字DNS日志数据集进行的。 提出了有趣的模式,表明基于数据挖掘的方法在DNS服务领域中是合适且有希望的。
2022-12-29 15:31:56 640KB Data mining; Clustering; Frequent
1