提出了一种基于遗传算法的大数据特征选择算法。该算法首先对各维度的特征进行评估,根据每个特征在同类最近邻和异类最近邻上的差异度调整其权重,基于特征权重引导遗传算法的搜索,以提升算法的搜索能力和获取特征的准确性;然后结合特征权重计算特征的适应度,以适应度作为评价指标,启动遗传算法获取最优的特征子集,并最终实现高效准确的大数据特征选择。通过实验分析发现,该算法能够有效减小分类特征数,并提升特征分类准确率。
2021-10-14 17:35:11 1.01MB 大数据 特征选择 遗传算法
1
汽车企业网络广告位选择方法研究.docx
2021-10-14 14:07:11 20KB 网络
在高维数据如图像数据、基因数据、文本数据等的分析过程中,当样本存在冗余特征时会大大增加问题分析复杂难度,因此在数据分析前从中剔除冗余特征尤为重要。基于互信息(MI)的特征选择方法能够有效地降低数据维数,提高分析结果精度,但是,现有方法在特征选择过程中评判特征是否冗余的标准单一,无法合理排除冗余特征,最终影响分析结果。为此,提出一种基于最大联合条件互信息的特征选择方法(MCJMI)。MCJMI选择特征时考虑整体联合互信息与条件互信息两个因素,两个因素融合增强特征选择约束。在平均预测精度方面,MCJMI与信息增益(IG)、最小冗余度最大相关性( mRMR)特征选择相比提升了6个百分点;与联合互信息(JMI)、最大化联合互信息(JMIM)相比提升了2个百分点;与LW向前搜索方法( SFS-LW)相比提升了1个百分点。在稳定性方面,MCJMI稳定性达到了0.92,优于JMI、JMIM、SFS-LW方法。实验结果表明MCJMI能够有效地提高特征选择的准确率与稳定性。
2021-10-11 14:36:12 1.25MB 消费电子
1
介绍了遗传算法和模拟退火算法的特征选择方法
1
当面临许多变量时,很自然的要进行变量的初次筛选,以便减缓后续的建模计算压力。本文提出了一种新的有效的变量选择方法,不依赖于模型的清晰指定,故而具有很大的灵活性与适应范围。
2021-10-09 10:59:39 604KB 111111111
1
基于词频与词位置信息的混合式文本特征选择方法软件工程分析.docx
2021-10-08 23:11:13 18KB C语言
论文研究一种基于类差分度的互信息特征选择方法.zip
2021-10-06 13:03:11 236KB
众所周知,没有足够的关于神经模糊分类器的 Matlab 程序。 一般使用ANFIS作为分类器。 ANFIS 是一个函数逼近程序。 但是,使用 ANFIS 进行分类是不利的。 例如,有3个类别,分别标记为1、2和3。ANFIS输出不是整数。 出于这个原因,ANFIS 输出被四舍五入,并确定了类标签。 但是,有时,ANFIS 可以给出 0 或 4 个类别标签。 不接受这些情况。 因此,ANFIS 不适用于分类问题。 在这项研究中,我准备了不同的自适应神经模糊分类器。 在下面给出的所有程序中,我使用 k-means 算法来初始化模糊规则。 出于这个原因,用户应该给出每个类的簇数。 此外,高斯隶属函数仅用于模糊集描述,因为其简单的导数表达式第一个是 scg_nfclass.m。 该分类器基于 Jang 的神经模糊分类器 [1]。 区别在于规则权重和参数优化。 规则权重根据规则样本的数量进行调整。
2021-10-01 18:49:09 28KB matlab
1
基于熵的供应链伙伴RBF神经网络选择方法.pdf
2021-09-25 22:05:39 1.14MB 神经网络 深度学习 机器学习 数据建模