K-means算法处理海量数据时,易产生系统内存溢出的现象。利用MapReduce框架改进K-means虽然解决了这个问题,但也存在着聚类效果不稳定以及准确率不高等问题,提出一种改进算法,利用MapReduce框架实现K-means时,采用多次随机抽样,通过计算密度、距离与平方误差等方法,最终选取较优的初始聚类中心,并在迭代中采用新的中心点计算方法。实验结果证明,改进后的算法具有较好的稳定性、准确性和加速比。
2022-04-07 14:54:55 630KB 论文研究
1
k-means算法 k-means算法,也被称为k-平均或k-均值,是一种得到最广泛使用的聚类算法。相似度的计算根据一个簇中对象的平均值来进行。 算法首先随机地选择k个对象,每个对象初始地代表了一个簇的平均值或中心。对剩余的每个对象根据其与各个簇中心的距离,将它赋给最近的簇。然后重新计算每个簇的平均值。这个过程不断重复,直到准则函数收敛。 准则函数试图使生成的结果簇尽可能地紧凑和独立。 算法5-1 k-means算法 输入:簇的数目k和包含n个对象的数据库。 输出:k个簇,使平方误差准则最小。 (1)assign initial value for means; /*任意选择k个对象作为初始的簇中心;*/ (2) REPEAT (3) FOR j=1 to n DO assign each xj to the closest clusters; (4) FOR i=1 to k DO / *更新簇平均值*/ (5) Compute /*计算准则函数E*/ (6) UNTIL E不再明显地发生变化。
2022-03-17 12:13:50 598KB 聚类 数据挖掘 伪代码 例子
1
 针对电力大数据收集和存储中数据量大、数据收集不精准的问题,提出了基于改进K-means算法的电力大数据系统的设计。对传统K-means算法进行分析,提出改进之后的K-means算法。根据改进后算法设计电力大数据系统,对系统的架构进行分析,包括数据存储、设备层、数据接入等模块。对设计的电力大数据系统进行实验,实验结果表明,文中设计的电力大数据系统能够满足实际需求,提高系统的存储和处理效率。
2022-03-15 16:55:36 1.48MB K-means算法 电力 大数据 架构分析
1
K均值(k-Means)算法的推导 问题框架 要估计k个正态分布的均值= 观察到的数据是X={} 隐藏变量Z={}表示k个正态分布中哪一个生成xi 用于K均值问题的表达式Q(h’|h)的推导 单个实例的概率
2022-03-12 16:49:34 7.1MB 机器学习 算法汇总
1
k-means 算法的matlab代码 基于多特征分析的视频窜改检测算法 运行平台:Matlab 简要使用说明 利用两个算法来检测视频是否经过篡改,方法1针对大范围帧间篡改(帧删除、帧替换、帧插入); 方法2作为方法1的补充,对小范围篡改也许会有一点改善(然而并没有); 方法1:基于视频相关性变化的视频篡改检测算法 利用视频内容具有连续性这一特点,提取相关性变化度这一特征,通过K-means算法挑出帧异常点; 方法2:基于运动矢量分析的视频篡改检测 利用光流法求出运动矢量,将运动矢量这一阶段特征输入SVM分类器,通过学习后训练出模型,将待检测视频导入训练模型,检测篡改点; 代码说明 对主要的程序进行简单说明 为利用相关性变化度为特征,利用二次切比雪夫挑出离群点; [1]黄添强, 陈智文, 苏立超,等. 利用内容连续性的数字视频篡改检测[J]. 南京大学学报(自然科学版), 2011, 47(5):493-503. 为方法1; <checkErrorFramePointBySV
2022-03-10 10:17:46 9KB 系统开源
1
MATLAB实现K-Means算法,输入的数据为待分类的图片,以及分类数。这个代码是针对单波段的,稍微改一下就可以进行多波段的。
2022-03-06 16:19:05 2KB 遥感数字图像处理
1
【程序老媛出品,必属精品,亲测校正,质量保证】 资源名:matlab k-means算法 程序源码.zip 资源类型:程序源代码 源码说明: matlab实现 k-means算法 程序 包含完整代码 非常适合借鉴学习 适合人群:新手及有一定经验的开发人员
2022-02-05 14:09:41 2KB kmeans matlab matlab实现k-means 程序源码
基于半监督K-means的主动学习聚类算法 ,孙凯,孟祥武,针对K-means算法对初始聚类中心敏感,针对不规则聚类簇效果较差的缺点,提出了一种基于半监督K-means的主动学习算法。为了针对指定的k
1
简单的实现了K_means算法的可视化,这里分析的主要是坐标信息,数据源是文本信息txt文件。数据源大家可以修改
2022-01-23 19:12:16 1KB kmeans算法
1
从网上找的代码自己改了下,写了了个短小的人工智能作业K-MEANS算法
2022-01-11 16:18:04 192KB 人工智能 K-MEANS算法 实验报告 源代码
1