针对数据库用户行为异常导致数据库泄露问题,提出了一种基于K-means和naive Bayes算法的数据库用户异常检测方法。首先,利用数据库历史审计日志中用户的查询语句与查询结果,采用K-means聚类方法得到用户的分组;然后,使用naive Bayes分类算法构造用户异常检测模型。与单独使用naive Bayes分类法构造的模型相比,在数据预处理时其精简了用户行为轮廓的表示方法,降低了计算冗余,减少了81%的训练时间;利用K-means聚类方法得到用户组别,使检测的精确率提高了7.06%,F1值提高了3.33%。实验证明,所提方法大幅降低了训练时间,取得了良好的检测效果。
2021-10-15 15:32:32 1.03MB 数据库 用户行为 异常检测
1
基于Matlab实现: 模式识别 改进的K-Means++算法 实现模式分类
2021-10-15 15:08:25 1KB 模式识别 matab K-Mean K-Mean
1
用于聚类多元数据的 k-means++ 算法的有效实现。 已经表明,该算法具有对 log(k) 竞争的总簇内距离的期望值的上限。 此外,k-means++ 通常比普通 k-means 收敛得多。
2021-10-15 11:41:59 2KB matlab
1
matlab sift,k-means等算法工具箱
2021-10-15 11:19:46 12.26MB sift k-means
1
本实验为了解和测试模糊算法并在实际背景下进行应用。 1、 寻找合适的具有实际意义的数据集。 2、 根据数据集进行matlab自带的kmeans函数和fcm函数进行分类与分析。 3、 自己设计算法myKmeans函数对数据集进行分类。 数据集1:威斯康星州乳腺癌数据集 原因:目前癌症的初步检测还是主要依靠医生的经验判断,为了提高医生的工作效率,以及减少医生的经验判断失误,所有希望计算机协助医生进行判断。 目标:根据已有的对乳腺癌的特征的分类,判断患者的乳腺癌是属于良性还是恶性,进一步帮助患者的治疗。 数据集2:胸外科数据集 原因:目前肺癌治疗主要肺切除术虽然已经成熟,但是患者是否该接受手术还是应该慎重的评定。 目标:根据已有的数据的特征的分类,判断患者是否应该接受手术治疗,有无成功率。 --------------------- 作者:zxm_ 来源:CSDN 原文:https://blog.csdn.net/zxm_jimin/article/details/87938542 版权声明:本文为博主原创文章,转载请附上博文链接!
2021-10-14 20:44:13 14KB K-means应用 数据集
1
基于K_means聚类的室内三维定位算法
2021-10-14 15:59:19 528KB 研究论文
1
提供了k-means多维数据的聚类分析matlab源代码代码
2021-10-14 14:40:46 1KB k-means聚类 多维数据
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料亲测可用, 谢谢支持。
2021-10-12 15:33:25 685KB 5.1
1
k-means聚类算法及matlab代码 数据挖掘实验 实验一:相似度、距离、最近邻分类器 1、实验目的 (1)理解相似度、距离的度量方式。 (2)理解最近邻分类器的工作原理。 2、实验内容 (1)、实现任意给定两个相同维度的向量之间的欧氏距离计算函数 function dist = dist_E(x,y) (2)、实现任意给定两个相同维度的向量之间的夹角余弦相似度计算函数 function sim = sim_COS(X,Y) (3)、实现K最近邻算法 KNN算法思想 输入参数:k值、trainingSamples(训练数据集,MN矩阵,M为样本数,N为属性 数)、trainingLabels(训练数据集的分类标签0、1、2...,M1矩阵), testingSample (测试数据,1*N矩阵) 输出参数:class(测试数据对应类别标签) 算法流程: 得到训练数据集trainingSamples的大小M,N 初始化Distance数组(M*1),用来存储每个训练样本与测试样本的距离。 对每一个训练样本trainingSamples(i,:)【for i=1:M】,计算其与测试样本
2021-10-11 15:36:05 789KB 系统开源
1
算法描述:K均值算法: 给定类的个数K,将N个对象分到K个类中去, 使得类内对象之间的相似性最大,而类之间的相似性最小。
2021-10-10 17:20:09 5KB c语言 K-Means
1