Jx-FFST:过滤器特征选择工具箱 -------------------------------------------------- -------------------------------------------------- -------------------------------------------------- ------------- * 此工具箱包含 4 种过滤器特征选择方法 * 显示了如何在基准数据集上使用这些过滤器功能选择的示例 * 这个 Jx-WFST 工具箱的详细信息可以在https://github.com/JingweiToo/Filter-Feature-Selection-Toolbox找到
2021-11-13 23:16:43 62KB matlab
1
描述: 用于以下基于MI的特征选择方法的代码(Matlab / C ++ Mex): - 最大相关性 (maxRel) - 最小冗余最大相关性(MRMR) - 最小冗余 (minRed) - 二次编程特征选择 (QPFS) - 互信息商(MIQ) - 最大相关最小总冗余 (MRMTR) 或扩展 MRMR (EMRMR) - 光谱松弛全局条件互信息 (SPEC_CMI) - 条件互信息最小化 (CMIM) - 条件 Infomax 特征提取 (CIFE) 参考: [1] Nguyen X. Vinh、Jeffrey Chan、Simone Romano 和 James Bailey,“基于互信息的特征选择的有效全局方法”。 2014 年 8 月 24 日至 27 日在纽约市举行的第 20 届 ACM SIGKDD 知识发现和数据挖掘会议 (KDD'14) 上发表。
2021-11-11 18:29:29 64KB matlab
1
基于最大信息系数和Gram-Schmidt正交化的生物医学数据过滤特征选择方法
2021-11-05 17:05:29 1.12MB 研究论文
1
Lasso方法与其他特征选择一样,对高维海量或高维小样本数据集的特征选择容易出现计算开销过大或过学习问题(过拟合)。为解决此问题,提出一种改进的Lasso方法:迭代式Lasso方法。迭代式Lasso方法首先将特征集分成K份,对第一份特征子集进行特征提取,将所得特征加入第二份,再对第二份特征进行特征提取;然后将所得特征加入第三份,依次迭代下去,直到第K份,得到最终特征子集。实验表明,迭代式Lasso方法能够很好地对高维海量或高维小样本数据集进行特征选择,是一种有效的特征选择方法。目前,此方法已经很好地应用在高维海量和高维小样本数据的分类或预测模型中。
2021-10-15 19:52:18 220KB Lasso 特征选择 迭代式Lasso
1
提出了一种基于遗传算法的大数据特征选择算法。该算法首先对各维度的特征进行评估,根据每个特征在同类最近邻和异类最近邻上的差异度调整其权重,基于特征权重引导遗传算法的搜索,以提升算法的搜索能力和获取特征的准确性;然后结合特征权重计算特征的适应度,以适应度作为评价指标,启动遗传算法获取最优的特征子集,并最终实现高效准确的大数据特征选择。通过实验分析发现,该算法能够有效减小分类特征数,并提升特征分类准确率。
2021-10-14 17:35:11 1.01MB 大数据 特征选择 遗传算法
1
在高维数据如图像数据、基因数据、文本数据等的分析过程中,当样本存在冗余特征时会大大增加问题分析复杂难度,因此在数据分析前从中剔除冗余特征尤为重要。基于互信息(MI)的特征选择方法能够有效地降低数据维数,提高分析结果精度,但是,现有方法在特征选择过程中评判特征是否冗余的标准单一,无法合理排除冗余特征,最终影响分析结果。为此,提出一种基于最大联合条件互信息的特征选择方法(MCJMI)。MCJMI选择特征时考虑整体联合互信息与条件互信息两个因素,两个因素融合增强特征选择约束。在平均预测精度方面,MCJMI与信息增益(IG)、最小冗余度最大相关性( mRMR)特征选择相比提升了6个百分点;与联合互信息(JMI)、最大化联合互信息(JMIM)相比提升了2个百分点;与LW向前搜索方法( SFS-LW)相比提升了1个百分点。在稳定性方面,MCJMI稳定性达到了0.92,优于JMI、JMIM、SFS-LW方法。实验结果表明MCJMI能够有效地提高特征选择的准确率与稳定性。
2021-10-11 14:36:12 1.25MB 消费电子
1
介绍了遗传算法和模拟退火算法的特征选择方法
1
基于词频与词位置信息的混合式文本特征选择方法软件工程分析.docx
2021-10-08 23:11:13 18KB C语言
论文研究一种基于类差分度的互信息特征选择方法.zip
2021-10-06 13:03:11 236KB
众所周知,没有足够的关于神经模糊分类器的 Matlab 程序。 一般使用ANFIS作为分类器。 ANFIS 是一个函数逼近程序。 但是,使用 ANFIS 进行分类是不利的。 例如,有3个类别,分别标记为1、2和3。ANFIS输出不是整数。 出于这个原因,ANFIS 输出被四舍五入,并确定了类标签。 但是,有时,ANFIS 可以给出 0 或 4 个类别标签。 不接受这些情况。 因此,ANFIS 不适用于分类问题。 在这项研究中,我准备了不同的自适应神经模糊分类器。 在下面给出的所有程序中,我使用 k-means 算法来初始化模糊规则。 出于这个原因,用户应该给出每个类的簇数。 此外,高斯隶属函数仅用于模糊集描述,因为其简单的导数表达式第一个是 scg_nfclass.m。 该分类器基于 Jang 的神经模糊分类器 [1]。 区别在于规则权重和参数优化。 规则权重根据规则样本的数量进行调整。
2021-10-01 18:49:09 28KB matlab
1