传统的K-modes算法采用简单的属性匹配方式计算同一属性下不同属性值的距离,并且计算样本距离时令所有属性权重相等。在此基础上,综合考虑有序型分类数据中属性值的顺序关系、无序型分类数据中不同属性值之间的相似性以及各属性之间的关系等,提出一种更加适用于混合型分类数据的改进聚类算法,该算法对无序型分类数据和有序型分类数据采用不同的距离度量,并且用平均熵赋予相应的权重。实验结果表明,改进算法在人工数据集和真实数据集上均有比K-modes算法及其改进算法更好的聚类效果。
2022-08-21 23:37:28 527KB 论文研究
1
DBSCAN 聚类,是一种基于密度的聚类算法,它类似于均值漂移,DBSCAN 与其他聚类算法相比有很多优点,首先,它根本不需要固定数量的簇。它也会异常值识别为噪声,而不像均值漂移,即使数据点非常不同,也会简单地将它们分入簇中。另外,它更抗噪音,能够很好地找到任意大小和任意形状的簇。DBSCAN的聚类过程就是根据核心弱覆盖点来推导出最大密度相连的样本集合,首先随机寻找一个核心弱覆盖样本点,按照 Minpts 和 Eps 来推导其密度相连的点,然后再选择一个没有赋予类别的核心弱覆盖样本点,开始推导其密度相连的样本结合,一直迭代到所有的核心样本点都有对应的类别为止。作者博客中详细介绍了DBSCAN的算法原理,可以通过文章结合学习,代码包含详细注释,只需要导入自己的聚类数据,运行代码便可以得出聚类结论与图像。
2022-08-16 13:05:39 4KB DBSCAN 数学建模 python 算法
1
机器学习聚类算法学习文档
2022-08-11 11:05:34 9.69MB 机器学习
1
- K 表示算法使用不同的初始质心执行以获得最佳聚类。 - 总成本的计算方法是将每个点到其聚类中心的距离相加,然后对所有聚类求和。 - 基于在 'iterKMeans' 每次迭代期间实现的最小总成本,将像素分配给它们各自的集群,并获得最终的压缩图像。 - 随着集群数量、图像大小和迭代次数的增加,该算法运行速度将变慢。
2022-08-08 01:42:49 1.2MB matlab
1
通过聚类优化RBF神经网络参数,拟合曲线的小程序
2022-07-16 20:04:57 1KB 聚类算法 RBF神经网络 matlab
1
给出的程序可用于未知工况的识别或分类问题,属于数据处理的一个环节
2022-07-15 11:00:51 1KB 工况识别 Kmeans 工况 K均值聚类算法
1
用matlab语言实现K-MEANS聚类算法
2022-07-12 20:09:33 7KB K-MEANS聚类算法 matlab
高维数据子空间聚类算法研究.pdf
2022-07-12 14:08:03 892KB 文档资料
数据挖掘中几种划分聚类算法的比较及改进.pdf
2022-07-11 19:13:06 1.74MB 文档资料
数据挖掘中的聚类算法综述.pdf
2022-07-11 19:13:03 119KB 文档资料