当提供不适当的参数或将其应用于由具有不同形状,大小和密度的聚类组成的数据集时,大多数聚类算法将变得无效。 为了缓解这些不足,我们提出了一种新颖的拆分合并层次聚类方法,其中采用最小生成树(MST)和基于MST的图来指导拆分和合并过程。 在分割过程中,选择基于MST的图中具有高度的顶点作为初始原型,并使用K均值来分割数据集。 在合并过程中,将对子组对进行过滤,并且仅考虑相邻对。 所提出的方法除了簇数以外不需要任何参数。 实验结果证明了其在合成和真实数据集上的有效性。
2023-02-25 08:54:26 1.76MB Data sets; Hierarchical clustering
1
Python 58同城房价bs4 beautiful soup爬虫获取 room_name room_type room_area room_addr0 room_addr1 room_price房价名称类型面积地址价格等 jieba中文分词 tf-idf向量化 kmeans聚类 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-02-22 22:22:27 113KB jieba NLP 爬虫 kmeans
1
一种基于线路轨迹的公交站点聚类算法,王进,,随着移动互联网和手机定位技术的发展,出现了越来越多的基于地理位置的服务(LBS),地图数据和公共交通数据是这些应用和服务的数据基
2023-02-22 19:44:29 312KB 数据挖掘
1
DTWMatlab代码STF_DTW 震源时间函数的DTW聚类。 这些代码用于复制 J. Yin、Z. Li 和 MA Denolle 手稿“震源时间函数聚类揭示地震动力学模式”中的结果和数字。 手稿已提交给 AGU Advances。 预印本可在此处获得: 对于结果再现,直接在 Matlab 中运行 Main_run_SCARDEC.m 和 Main_run_Simulation.m。 参数设置和详细信息可以在这两个脚本的注释中找到。
2023-02-22 13:21:20 12.49MB 系统开源
1
matlab系统聚类代码随机对战系列 RandomWarpingSeries(RWS)是用于生成时间序列矢量表示的简单代码,用于时间序列分类,聚类和回归。 该代码是WME中的WME的简单实现(Matlab,Matlab MEX和C的混合)(Wu等人,“随机变形序列:用于时间序列嵌入的随机特征方法”,AISTATS'18)。 我们将有关RWS的更多信息引至以下论文链接:。 先决条件 为了运行此代码,至少有两个必需的工具包。 您需要下载DTW,LibLinear或LibSVM并为您的操作系统(Mac,Linux或Windows)编译相应的MEX文件。 对于DTW: 对于LibSVM:或LibLinear: 对于单变量时间序列数据集,您可以从UCR时间序列集合()或UEA时间序列集合()下载一些数据集。 对于多元时间序列数据集,您可以从UCI机器学习存储库()或您喜欢的应用程序中下载一些数据集。 通常建议先将数据进行Z形式化处理,然后再将其提供给我们的时间序列嵌入代码。 如何运行代码 请注意,为了获得最佳性能,必须搜索超参数DMax,sigma甚至lambda_inverse(用于使用SVM
2023-02-21 23:20:38 24.16MB 系统开源
1
很好的matlab写的高斯混合模型包,包括聚类回归等等。 有详细的函数功能说明。
2023-02-19 16:27:04 14.43MB 高斯混合模型 聚类 回归等等 matlab
1
将二部图模型引入聚类集成问题中,使用二部图模型同时建模对象集和超边集,充分挖掘潜藏在对象之间的相似度信息和超边提供的属性信息.设计正则化谱聚类算法解决二部图划分问题,在低维嵌入空间运行K-means++算法划分对象集,获得最终的聚类结果.在多组基准数据集上进行实验,实验结果表明所提出方法不仅能获得优越的结果,而且具有较高的运行效率.
1
基于聚类和神经网络的热轧轧制力综合预报研究,石露露,何飞,为了提高热轧生产过程精轧机组的轧制力预设定精度,需要对轧制力进行高精度的预报。本文通过理论公式计算出轧制力的近似值,然后
2023-02-12 18:48:42 555KB 首发论文
1
nmf的matlab代码对称NMF用于图聚类 对称非负矩阵因式分解(SymNMF)是一种无监督的图聚类算法,发现了许多用例及其扩展,这些用例涉及生物信息学和基因组研究。 这个Matlab软件包是为以下论文开发的: Da Kuang, Chris Ding, Haesun Park, Symmetric Nonnegative Matrix Factorization for Graph Clustering, The 12th SIAM International Conference on Data Mining (SDM '12), pp. 106--117, 2012. 和日记版本: Da Kuang, Sangwoon Yun, Haesun Park, SymNMF: Nonnegative low-rank approximation of a similarity matrix for graph clustering, Journal of Global Optimization, 62(3):545-574, 2015. 如果发现该代码有用,请引用本文。 问题陈述 S
2023-02-12 15:54:20 19KB 系统开源
1
针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-means算法的聚类结果进行对比分析。实验证明:改进后的算法稳定,且聚类的准确率达到了92%。
2023-02-10 03:10:05 932KB 自然科学 论文
1