k-means聚类算法及matlab代码稀疏的KMeans KMeans使用预处理和稀疏化实现大数据,Matlab实施。 使用(也称为“ K均值”或“ K均值”),但以特殊方式稀疏数据,以显着(且可调)节省计算时间和内存。 该代码提供kmeans_sparsified ,其用法与Matlab统计工具箱中的kmeans函数非常相似。 有三个好处: 基本实现比“统计信息”工具箱版本快得多。 我们还提供了一些工具箱版本所缺少的现代选项。 例如,我们实现了初始化。 (更新:自2015年以来,Matlab改进了例程和初始化的速度,现在它们的版本与我们的版本相当)。 我们有一个新的变体,称为稀疏KMeans,它可以对数据进行预处理和采样,而该版本可以快数千倍,并且是为无法处理的大数据集设计的 该代码还允许使用大数据选项。 无需传递数据矩阵,而是给它提供.mat文件的位置,并且代码会将数据分成多个块。 当数据为10 TB并且您的计算机只有6 GB的RAM时,这很有用。 数据以较小的块(例如,小于6 GB)加载,然后进行预处理,采样并从RAM中丢弃,然后处理下一个数据块。 整个算法仅遍历数据集。 /注
2022-04-27 13:54:36 860KB 系统开源
1
K-means算法简介及代码过程
2022-04-26 09:10:27 16KB kmeans 算法 机器学习 人工智能
1
包含KMeans以及KMeans++聚类算法的python实现,以及测试文件读写的框架程序。其中KMeans.py是以随机初始化聚类中心的方法实现聚类,KMeanspp.py则是以KMeans++的方式初始化聚类中心。testKMeans.py则是主函数入口,负责打开文件,调用算法,显示运行结果。所有文件用python编写,并配有详细注释。
2022-04-26 09:09:43 4KB kmeans python 算法 计算机视觉
1
K均值聚类算法的源程序,用来数据聚类操作
2022-04-25 18:48:50 9KB Kmeans K.
人工智能-项目实践-图像聚类-Kmeans方法对图像色彩进行聚类
2022-04-23 19:06:03 1.01MB kmeans 聚类 数据挖掘 图像聚类
Python biKmeans 二分聚类算法
2022-04-19 21:32:02 1KB Python biKmeans
1
今天用python实现了一下简单的聚类分析,顺便熟悉了numpy数组操作和绘图的一些技巧,在这里做个记录。 from pylab import * from sklearn.cluster import KMeans ## 利用numpy.append()函数实现matlab多维数组合并的效果,axis 参数值为 0 时是 y 轴方向合并,参数值为 1 时是 x 轴方向合并,分别对应matlab [A ; B] 和 [A , B]的效果 #创建5个随机的数据集 x1=append(randn(500,1)+5,randn(500,1)+5,axis=1) x2=append(randn(50
2022-04-18 17:06:00 99KB axis kmeans ns
1
利用sift++kmeans++tf_idf++svm实现场景分类、图像分类
2022-04-16 22:26:55 3KB image classi kmeans sift
1
em算法matlab代码Kmeans项目 该项目利用K均值和EM算法进行预测。 入门 该项目包含3个用python编写的程序。 第一个文件是Kmeans.py,它实现了k means算法。 第二个文件是实现EM算法的GMM.py。 第三个文件是gmSuper.py,其中包含在GMM.py中实现的类GMM。 无需运行此文件,而是将其保存在同一目录中。 还有一个名为'pre_post_proc.m'的Matlab文件,该文件生成报告中显示的统计信息。 仅应打开它以验证统计信息。 还提供了一个data2.csv,它用作聚类算法的输入数据。 解压缩该文件夹,并将所有内容保留在同一目录中。 所有情节将自己生成。 每个文件的开头都定义了一个变量NUMBER。 更改其值以更改群集数。 重要信息:弹出图形窗口时,请关闭它以使代码继续进行。 还将生成一个空白图形窗口。 请关闭它,然后忽略它。 那不代表任何数字。 先决条件 该程序具有以下依赖性:Numpy Pandas Sklearn Matplotlib Seaborn yellowbrick 正在安装 通过创建虚拟环境来安装依赖项(推荐): 打开一个
2022-04-16 11:41:04 790KB 系统开源
1