GA_for_Feature_Selection 使用遗传算法结合决策树做特征选择 Using genetic algorithm for feature selection with decision tree 原始遗传算法参考 import numpy as np import pandas as pd import random data_train = pd.read_csv('\data_train.csv') data_test = pd.read_csv('\data_test.csv') #合并训练集测试集 data = data_train.append(data_test).drop(['id'], axis=1) feature_names = data.columns pop_size = 20 # 种群数量 max_value = 10 #
2022-04-18 23:00:27 2KB
1
自20世纪90年代以来,特征选择成为模式识别和机器学习领域的重要研究方向,研究成果十分显著,但是也存在许多问题需要进一步研究。本文首先将特征选择视为特征集合空间中的启发式搜索问题,对特征选择涉及的四个要素进行了阐述,然后从各个角度对特征选择算法进行了分类,概述了其各个分支的发展态势,最后探讨了基于多目标免疫优化的特征选择方法的研究思路。
2022-04-16 15:33:19 724KB 特征选择 特征子集 搜索
1
特征选择示例ddddddddddd
2022-04-14 18:00:48 605KB spark
1
文章目录前言1.数据集选择2.feature-selector用法3.具有高missing-values百分比的特征4.具有高相关性的特征5.对模型预测结果无贡献的特征6.对模型预测结果只有很小贡献的特征7.具有单个值的特征8.从数据集去除选择的特征9.结论 前言        FeatureSelector是用于降低机器学习数据集的维数的工具。        文章介绍地址        项目地址        本篇主要介绍一个基础的特征选择工具feature-selector,feature-selector是由Feature Labs的一名数据科学家williamkoehrsen写的特征选
2022-04-12 08:43:04 744KB c cto ec
1
采用基于遗传算法(GA)的二维主成分分析法(2DPCA)进行人脸识别。2DPCA 直接以二维图像矩阵为研究对象,以其 协方差矩阵的特征向量为投影轴进行特征提取。
2022-04-10 16:37:18 173KB 遗传算法,特征选择
1
在实际情况中,分类中使用的许多特征选择方法都直接应用于排序 我们认为,由于排名和分类之间的显著差异,最好开发不同的特征选择方法进行排名。 本文提出了一种新的特征选择方法
2022-04-07 09:08:26 824KB 特征选择 算法
基于特征选择的软件缺陷预测方法.pdf
2022-04-06 00:22:59 1.01MB 技术文档
pyHSICLasso pyHSICLasso是希尔伯特·施密特(Hilbert Schmidt)独立标准套索(HSIC Lasso)的软件包,这是一种考虑了非线性输入和输出关系的黑匣子(非线性)特征选择方法。 HSIC Lasso可以看作是广泛使用的最小冗余最大相关性(mRMR)特征选择算法的凸变体。 HSIC套索的优势 可以有效地找到与非线性相关的特征。 可以找到非冗余功能。 可以获得全局最优的解决方案。 可以通过内核处理回归和分类问题。 功能选择 监督性特征选择的目标是找到负责预测输出值的输入特征子集。 通过使用它,您可以补充非线性输入和输出的依赖性,并且可以有效地计算高维问题的最优解。 通过针对数以千计的特征进行分类和回归的特征选择实验证明了其有效性。 在许多实际应用中,例如从微阵列数据中选择基因,文档分类和假体控制,在高维监督学习中寻找功能的子集是一个重要的问题。 安装
1
为解决传统隐马尔可夫股价行为预测模型对输入特征序列和隐含状态数目敏感,导致预测结果存在局部最优、误差较大的问题,设计了新的股票因子特征选择方法,包括对因子特征的筛选和特征数据预处理。结合贝叶斯信息规则确定模型最佳隐含状态数目,提出了一种优化股价行为预测性能的PRHMM模型。通过对比支持向量机、ARIMA模型,实验结果证明,所提出的预测算法相对传统预测模型,在股价行为预测中有更好的预测表现。
2022-03-30 13:33:42 253KB 隐马尔可夫模型
1