k-means聚类算法及matlab代码稀疏的KMeans KMeans使用预处理和稀疏化实现大数据,Matlab实施。 使用(也称为“ K均值”或“ K均值”),但以特殊方式稀疏数据,以显着(且可调)节省计算时间和内存。 该代码提供kmeans_sparsified ,其用法与Matlab统计工具箱中的kmeans函数非常相似。 有三个好处: 基本实现比“统计信息”工具箱版本快得多。 我们还提供了一些工具箱版本所缺少的现代选项。 例如,我们实现了初始化。 (更新:自2015年以来,Matlab改进了例程和初始化的速度,现在它们的版本与我们的版本相当)。 我们有一个新的变体,称为稀疏KMeans,它可以对数据进行预处理和采样,而该版本可以快数千倍,并且是为无法处理的大数据集设计的 该代码还允许使用大数据选项。 无需传递数据矩阵,而是给它提供.mat文件的位置,并且代码会将数据分成多个块。 当数据为10 TB并且您的计算机只有6 GB的RAM时,这很有用。 数据以较小的块(例如,小于6 GB)加载,然后进行预处理,采样并从RAM中丢弃,然后处理下一个数据块。 整个算法仅遍历数据集。 /注
2022-04-27 13:54:36 860KB 系统开源
1
现有的聚类算法在提取用于聚类时间序列数据的平滑子空间方面很弱。 在本文中,我们提出了一种新的k均值类型平滑子空间聚类算法,称为时间序列k均值(TSkmeans),用于对时间序列数据进行聚类。 提出的TSkmeans算法可以有效地利用时间序列数据集的固有子空间信息来增强聚类性能。 更具体地说,平滑子空间由加权时间戳表示,加权时间戳指示这些时间戳对于聚类对象的相对判别力。 我们工作的主要贡献包括设计一个新的目标函数,以指导时间序列数据的聚类,以及开发新颖的更新规则,以针对平滑子空间进行迭代聚类搜索。 基于综合数据集和五个实际数据集,我们的实验结果证实,在诸如Accuracy,Fscore,RandIndex,和正常的共同信息。
2022-04-27 09:42:40 974KB Time series; k-means clustering;
1
K-means算法简介及代码过程
2022-04-26 09:10:27 16KB kmeans 算法 机器学习 人工智能
1
k-means matlab程序最强合辑集合本网大部分!
2022-04-23 16:15:32 466KB k-means 模式识别 c matlab
1
基于余弦定理和K-means的植物叶片识别方法
2022-04-22 17:36:24 1014KB 研究论文
1
noma_dl_sim noma_dl_sim用于集群和配对算法。
1
电力需求分析 在时间序列数据集上分析房屋的电力需求。 还使用基于电力需求的 K-Means 聚类创建了电器检测系统。
2022-04-17 09:39:33 702KB
1
用户用电情况随着电网技术发展变得更加复杂,同时产生大量用电特征。以往采用基于神经网络挖掘方法和基于CURE算法的挖掘方法受到噪声数据影响,导致挖掘精准度较低,针对该问题,提出基于k-means聚类算法的用户复杂用电特征挖掘方法。在k-means聚类算法中,研究用户复杂用电特征挖掘原理,并对数据进行清洗、集成、规约变换预处理,避免噪声干扰。利用信息熵原则聚类矩阵规整特征点,根据复杂用电特征,通过簇类决策用电特征点,计算聚类簇之间距离,获取用电特征信息增益,完成用户复杂用电特征挖掘。通过实验对比结果可知,该方法挖掘精准度最高为99%,为用户提供更好优质服务。
1
k-means算法的C#实现,可以直接运行的,不过比较简单,仅仅是简单的原理说明。
2022-04-14 15:30:46 5.4MB K-means C#
1
k - means聚类分析算法Python实现,并以鸢尾花数据集为例进行聚类演示
2022-04-11 19:16:36 14KB 聚类
1