特征降维能够有效地提高机器学习的效率,特征子集的搜索过程以及特征评价标准是特征降维的两个 核心问题 。综述国际上关于特征降维的研究成果 ,总结并提出了较完备的特征降维模型定义 ; 通过列举解决特 征降维上重要问题的各种方案来比较各种算法的特点以及优劣 ,并讨论了该方向上尚未解决的问题和发展 趋势。
1
特征选择(特征子集选择)问题是各个领域中重要的预处理阶段之一。 在真实的数据集中,存在许多无用的不相关的、误导性的和冗余的特征。 主要特征可以通过特征选择技术来提取。 特征选择属于NP-hard问题; 因此,元启发式算法可用于解决该问题。 引入了一种新的二元 ABC,称为二元多邻域人工蜂群(BMNABC),以增强 ABC 阶段的探索和开发能力。 BMNABC 在第一和第二阶段应用具有新概率函数的近邻和远邻信息。 在第三阶段对那些在前几个阶段没有改进的解决方案进行了比标准 ABC 更有意识的搜索。 该算法可以与包装方法相结合以达到最佳效果。
2023-01-04 19:04:00 1.52MB matlab
1
现有过滤型特征选择算法并未考虑非线性数据的内在结构,从而分类准确率远远低于封装型算法,对此提出一种基于再生核希尔伯特空间映射的高维数据特征选择算法。首先基于分支定界法建立搜索树,并对其进行搜索;然后基于再生核希尔伯特空间映射分析非线性数据的内部结构;最后根据数据集的内部结构选择最优的距离计算方法。对比仿真实验结果表明,该方法与封装型特征选择算法具有接近的分类准确率,同时在计算效率上具有明显的优势,适用于大数据分析。
1
对垃圾图像判别问题中的特征提取和特征选择研究现状进行了总结。从特征的可区分性、鲁棒性和提取效率三个方面比较了垃圾图像判别中的主要特征,分析了特征的优缺点。结合分类学习算法、仿真实验结果,对已有的主要特征选择和分析方法进行比对,为进一步研究特征提取、特征选择方法,提高垃圾图像分类器的性能和效率提供有价值的参考。
2022-12-29 19:37:11 664KB 垃圾图像 特征提取 特征选择 分类器
1
缺陷预测旨在通过从历史缺陷数据中学习来估计软件的可靠性。 缺陷预测方法根据从软件项目中提取的指标来识别软件模块是否容易出现缺陷。 这些度量值(也称为特征)可能涉及不相关和冗余,这将损害缺陷预测方法的性能。 现有工作采用特征选择来预处理缺陷数据以滤除无用的特征。 在本文中,我们提出了一种新颖的特征选择框架MICHAC,它是通过层次聚类聚类通过最大信息系数进行缺陷预测的简称。 MICHAC分为两个主要阶段。 首先,MICHAC利用最大信息系数对候选特征进行排序,以过滤掉不相关的特征;其次,MICHAC通过分层聚集聚类对特征进行分组,并从每个结果组中选择一个特征以去除冗余特征。 我们使用三个具有四个性能指标(精度,召回率,F量度和AUC)的不同分类器,对11个被广泛研究的NASA项目和四个开源AEEEM项目评估了我们提出的方法。 与五种现有方法的比较表明,MICHAC可有效选择缺陷预测中的特征。
2022-12-28 17:17:59 271KB 研究论文
1
第 7 章:特征提取与特征选择第一部分:简述题1. 简述 PCA 的原理、学习模型和算法步骤。2. 简述 LAD 的原理和学习模型。3. 作为一类非线性降维方法
2022-12-27 18:07:48 131KB 算法 测试 matlab 软件/插件
1
Prism 使用统计方法的组合进行基于样条的多元回归。 Prism 通过平滑样条回归、PCA 和 RVR/LASSO 的组合,使用正则化、降维和特征选择来执行此回归。 如果使用工具箱,请引用本文: 马丹,CR(2016 年)。 Prism:具有正则化、降维和特征选择的多重样条回归。 开源软件杂志,31.doi:10.21105/joss.00031
2022-12-09 09:05:30 1.19MB matlab
1
机器学习特征选择方法综述
2022-11-30 13:24:55 536KB 特征 机器学习
1
在机器学习中,特征选择是对模型结果的优化和对特征的分析,无论是做机器学习分类或者回归模型,都可适用;在这里我使用(python)遗传算法对特征进行分析,然后选取最优特征建立机器学习回归模型。
1