现有过滤型特征选择算法并未考虑非线性数据的内在结构,从而分类准确率远远低于封装型算法,对此提出一种基于再生核希尔伯特空间映射的高维数据特征选择算法。首先基于分支定界法建立搜索树,并对其进行搜索;然后基于再生核希尔伯特空间映射分析非线性数据的内部结构;最后根据数据集的内部结构选择最优的距离计算方法。对比仿真实验结果表明,该方法与封装型特征选择算法具有接近的分类准确率,同时在计算效率上具有明显的优势,适用于大数据分析。
1
对垃圾图像判别问题中的特征提取和特征选择研究现状进行了总结。从特征的可区分性、鲁棒性和提取效率三个方面比较了垃圾图像判别中的主要特征,分析了特征的优缺点。结合分类学习算法、仿真实验结果,对已有的主要特征选择和分析方法进行比对,为进一步研究特征提取、特征选择方法,提高垃圾图像分类器的性能和效率提供有价值的参考。
2022-12-29 19:37:11 664KB 垃圾图像 特征提取 特征选择 分类器
1
缺陷预测旨在通过从历史缺陷数据中学习来估计软件的可靠性。 缺陷预测方法根据从软件项目中提取的指标来识别软件模块是否容易出现缺陷。 这些度量值(也称为特征)可能涉及不相关和冗余,这将损害缺陷预测方法的性能。 现有工作采用特征选择来预处理缺陷数据以滤除无用的特征。 在本文中,我们提出了一种新颖的特征选择框架MICHAC,它是通过层次聚类聚类通过最大信息系数进行缺陷预测的简称。 MICHAC分为两个主要阶段。 首先,MICHAC利用最大信息系数对候选特征进行排序,以过滤掉不相关的特征;其次,MICHAC通过分层聚集聚类对特征进行分组,并从每个结果组中选择一个特征以去除冗余特征。 我们使用三个具有四个性能指标(精度,召回率,F量度和AUC)的不同分类器,对11个被广泛研究的NASA项目和四个开源AEEEM项目评估了我们提出的方法。 与五种现有方法的比较表明,MICHAC可有效选择缺陷预测中的特征。
2022-12-28 17:17:59 271KB 研究论文
1
第 7 章:特征提取与特征选择第一部分:简述题1. 简述 PCA 的原理、学习模型和算法步骤。2. 简述 LAD 的原理和学习模型。3. 作为一类非线性降维方法
2022-12-27 18:07:48 131KB 算法 测试 matlab 软件/插件
1
Prism 使用统计方法的组合进行基于样条的多元回归。 Prism 通过平滑样条回归、PCA 和 RVR/LASSO 的组合,使用正则化、降维和特征选择来执行此回归。 如果使用工具箱,请引用本文: 马丹,CR(2016 年)。 Prism:具有正则化、降维和特征选择的多重样条回归。 开源软件杂志,31.doi:10.21105/joss.00031
2022-12-09 09:05:30 1.19MB matlab
1
机器学习特征选择方法综述
2022-11-30 13:24:55 536KB 特征 机器学习
1
在机器学习中,特征选择是对模型结果的优化和对特征的分析,无论是做机器学习分类或者回归模型,都可适用;在这里我使用(python)遗传算法对特征进行分析,然后选取最优特征建立机器学习回归模型。
1
针对大数据信号处理时的特征选择与特征降维,给出了4种有效的特诊选择方法
1
针对大数据信号处理时的特征选择与特征降维,给出了4种有效的特诊选择方法
1
针对轴承振动信号非线性、非平稳性和故障特征微弱性的特点,以及工程实际中难以获得大量故障样本的情况,提出了一种基于多尺度排列熵和支持向量机的轴承故障诊断新方法。该方法首先对轴承不同运行状态下的振动信号进行多尺度排列熵特征提取,然后通过距离评估技术从原始多尺度排列熵特征中选取敏感特征,最后将敏感特征输入到采用遗传算法优化的支持向量机中,实现对轴承不同运行状态的自动识别。对实验数据分析的结果表明,该方法可以精细地获取故障信息,从大量原始特征中选择出敏感特征,有效地实现滚动轴承故障状态的诊断。
1