针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法.该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信息熵过滤机制的K-means聚类算法将数据集划分成微聚类,并检测微聚类的离群点.通过实验结果分析表明:该算法可以有效提高高维数据流中离群点检测的效率和准确度.
1
属性约简matlab代码宫颈癌分析 分析来自 Kaggle 的数据集,使用 27 个可能与发展为宫颈癌有因果关系的属性,为宫颈癌诊断构建预测性二元分类模型。 该项目旨在通过奇异值分解、支持向量机和人工神经网络来了解哪些属性最能说明女性是否会患上宫颈癌。 该数据集包括 4 项诊断测试的结果:Hinselmann、席勒、细胞学和活检。 对 Hinselmann 结果进行了奇异值分解,而对所有 4 个结果都进行了 SVM 和 ANN 该项目是 MATH123: Mathematical Aspects of Data Analysis A 的最终项目,这是塔夫茨大学的一门课程 文件 宫颈癌 Python Main data analysis: Includes analysis via Support Vector Machine and Artificial Neural Networks (ANN) to build a binary classification model to determine whether or not someone would be diagnosed w
2021-11-13 13:10:59 4KB 系统开源
1
lda模型matlab代码PatternRecognition_Matlab 抽象的 通过训练数据集学习特征约简预测和分类器模型,并将其用于对测试数据集进行分类。 本文比较了几种减少特征的方法:主成分分析(PCA),线性判别分析(LDA)及其核方法(KPCA,KLDA)。 相应地,实现了几种分类算法:支持向量机(SVM),高斯二次最大似然和K近邻(KNN)和高斯混合模型(GMM)。 结论 我们的实验表明,SVM是增加维数空间的最可靠方法,而SVM和LDA对噪声最敏感。 文献资料 代码运行指令 输入数据 : 主功能 : 关于作者
2021-11-07 16:04:36 13.06MB 系统开源
1
三、基于粗糙集的属性约简 定义 对等价关系族R,存在r∈R,如果 则r为R中可省略的,否则称r为R中不可省略的。 (ind(R)表示集合中元素关于R不可分辨关系) 对于属性子集 ,若存在, , 使得 则Q为最小子集,则称Q为P的简化,记为
2021-11-06 15:03:55 656KB 粗糙集 PPT
1
传统基于邻域决策错误率的属性约简准则是针对总体分类精度的提升而设计的,未能展现因约简而引起的各类别精度变化情况。针对这一问题,引入局部邻域决策错误率以及局部属性约简的概念,其目的是提升单个类别的分类精度。在此基础上,进一步给出了求解局部邻域决策错误率约简的启发式算法。在8个UCI数据集上的实验结果表明,局部约简不仅是提高各个类别精度的有效技术手段,而且也解决了因全局约简所引起的局部分类精度下降问题。
2021-11-06 09:52:30 938KB 论文研究
1
以邻域粗糙集的属性重要度作为量度,从一个空集出发,前向贪心的选择重要度大的属性并入到约简集合,直到达到约简条件。
2021-11-02 16:49:43 23KB MATLAB 粗糙集 属性约简算法
1
粗糙集基础知识的程序实现(java),包括基于决策表的等价类计算、基于决策表的核属性计算和两种属性约简算法。
2021-10-18 17:48:54 19KB 决策表 属性约简 核属性 粗糙集
1
基于差别矩阵属性约简算法的改进
2021-10-14 19:27:06 454KB 差别矩阵 属性约简 算法的改进
1
基于维数约简的无监督聚类算法研究.docx
2021-10-08 23:11:22 52KB C语言
本文件包含采用粗糙集方法对属性进行约简的matlab程序以及程序的各部分函数详细说明,使用起来方便,上手快。
2021-10-08 10:14:36 14KB 粗糙集RSR 属性约简 matlab程序
1