Data-Mining-Project-2014- 这个存储库包含我的学术课程“数据挖掘”项目的文件。 该项目涉及使用 K-Means 聚类算法进行聚类。 该项目的主要目的是了解聚类并应用 K-Means 聚类算法对数据进行聚类。 数据包括主要赛事的各种网球比赛的结果。 首先,我们应用特征减少来减少数据的字段,然后应用 K-Means 算法。 程序运行的先决条件是: Hadoop 2.3.0 所有节点上的多节点集群设置 程序运行并相应地将数据集划分为 3 个集群:- 低获胜机会 中奖机会 高获胜机会
2023-04-02 20:44:04 55KB Java
1
针对私人微博内容进行聚类研究,结合私人微博的内容和结构特点提出了基于K-means的改进聚类算法。通过添加引用和评论内容丰富了文本内容,降低了短文本矩阵向量严重稀疏性带来的聚类算法准确性降低的影响;通过甄别“微话题”内容和改进相似度的计算,找到初始化类别并进行初步计算得到合适的类别数目和初始中心点,解决了K-means算法中聚类数目K需人工指定和初始中心点选取随机性的问题。实验结果表明,改进后的算法不仅可以自适应地得到K值,较普通的K-means算法在聚类的准确率上有所提高。
2023-04-01 22:52:14 306KB k-means算法
1
本论文是Clique聚类算法的经典论文,详细介绍了算法的基本原理,算法步骤,相关算法等,是进行Clique算法研究的很好的参考资料
2023-03-28 10:48:58 2.73MB 聚类 Clique 算法
1
针对模糊C均值本文提出将基于蚁群算法的模糊聚类算法应用于文本聚类中,聚类采用二级结构,蚁群算法(ACA)作为一级结构,模糊C均值聚类FCM用于二级结构。将此算法对文本集合进行聚类实验,并用分离系数、分离熵来判断模糊划分的效果,实验结果表明,与FCM相比,该算法具有较好的聚类效果。
2023-03-21 10:37:35 909KB 自然科学 论文
1
通过对几种典型聚类算法的分析和比较,提出了一种新的聚类算法,基于扩展约束的半监督谱聚类算法,简称CE-SSC。这种算法扩展了已知约束集,通过密度敏感距离改变样本点的相似关系,结合半监督谱聚类进行聚类。在UCI基准集上的仿真实验结果证明,基于扩展约束的半监督谱聚类算法具有良好的聚类效应。
2023-03-19 23:23:13 520KB 论文研究
1
模糊C均值聚类算法的实现(开发环境:codeblocks,C++)
2023-03-13 22:11:12 546KB FCM,聚类
1
kohonen网络的聚类算法—网络入侵聚类 供大家学习
2023-03-13 17:13:46 87KB 网络入侵聚类 kohone 聚类算法 matlab
1
压缩包中包含算法的Python实现代码、测试数据集及运行结果,可供感兴趣的同学参考。因为现在的实现并不能对所有的数据集都得到良好的效果,所以如果哪位同学有更好的想法,希望能不吝赐教。
2023-03-11 00:04:26 190KB 机器学习 聚类算法 无监督学习
1
kmeans聚类算法是一种迭代求解的聚类分析算法。其实现步骤如下: (1) 随机选取K个对象作为初始的聚类中心 (2) 计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。 (3) 聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。 (4) 重复步骤2、3直到满足某个终止条件。终止条件可以是聚类中心再发生变化或者误差平方和局部最小等。 此代码可直接运行,在此基础上进行二次开发任务!
2023-03-07 20:37:09 2KB matlab kmeans聚类算法
1
The code of Local Gravitation Clustering, see in the paper "Clustering by Local Gravitation " http://ieeexplore.ieee.org/document/7915751 citation: Z. Wang et al., "Clustering by Local Gravitation," in IEEE Transactions on Cybernetics, vol. 48, no. 5, pp. 1383-1396, May 2018. For Chinese readers who visit this page from my dissertation: 我的毕业论文的知网CAJ格式中很多图表显示有问题, 可能的原因是知网的CAJ格式对矢量图的支持不好, 而我提交的pdf版
2023-03-02 10:08:11 5KB matlab
1