主成分分析是一种常用的特征选择算法, 经典方法是计算各个特征之间的相关, 但是相关无法评估变量间 的非线性关系. 互信息可用于衡量两个变量间相互依赖的强弱程度, 且不局限于线性相关, 鉴于此, 提出一种基于互 信息的主成分分析特征选择算法. 该算法计算特征间的互信息, 以互信息矩阵的特征值作为评价准则确定主成分的 个数, 并衡量主成分分析特征选择的效果. 通过实例对所提出方法和传统主成分分析方法进行比较, 并以神经网络为 分类器分析分类效果.
1
在有监督的特征选择方法中,将根据其与用于教学分类器的标签信息的关系来选择将用于分类的特征。 在提出的研究中,使用两个不同的相关系数(一个参数和一个非参数)测量了这种关系。 皮尔逊(Pearson)被用作参数相关系数,肯德尔(Kendall)被用作非参数相关系数。 以彩色图像中的人体皮肤分割为案例研究,以证明参数和非参数相关系数的优势。 在彩色图像中,当基于像素应用皮肤分割时,该问题变成二元分类问题。 对于每个像素,提取基于颜色和纹理的72个特征。 根据获得的度量的顺序,将特征按高相关性分类为低相关性,并选择最强的特征进行分类。 分类器通过提取特征进行训练和测试,无论是否使用从Pratheepan数据库获得的特征选择方法。 再次添加消除的功能时,可以看出它的贡献很低,或者破坏了分类。 该代码旨在通过参数方法和非参数方法选择我们在本文中提到的72个功能。 您可以根据功能部件的数量修改代码。 引
2021-12-07 17:21:59 5KB matlab
1
近几十年来,人们生活水平显著提高,但是健康意识依旧薄弱,不良的生活习惯和饮食习惯导致糖尿病发病人数急剧增加,由糖尿病导致的各种并发症严重威胁了人们的健康.由于糖尿病具有知晓率低的特点,很多糖尿病患者未能及时发现病症,导致出现并发症.本文通过分析糖尿病的特点,针对医疗数据样本量小、容易缺失的特点,选择IV值分析进行特征选择、使用一种新型的Boosting算法CatBoost进行糖尿病患者预测,取得了显著的预测效果.
2021-12-05 17:36:46 853KB 糖尿病 IV值分析 特征选择 集成学习
1
针对模式识别时原始特征数量大而有冗余的现象,提出了一种基于遗传退火算法的特征选优方法,首先对遗传算法和模拟退火做了简要评论,然后在遗传算法中引入模拟退火的 Boltzmann 更新机制,以克服传统的遗传算法易于过早收敛和易于陷入局部极小的问题,最后阐述、设计了适应度函数和遗传算子。仿真实验表明,该方法在求解的效率和解的质量方面都达到了令人满意的效果。
1
三种常用的特征选择算法 卡方特征选择,互信息特征选择,信息增益特征选择(CHI,MI,IG) (Three kinds of commonly used feature selection algorithm, CHI, MI, IG)
2021-12-05 10:36:57 1KB 特征选择
1
博鲁塔沙普 BorutaShap是一种包装器特征选择方法,它结合了Boruta特征选择算法和Shapley值。 事实证明,这种组合在速度和生成的特征子集的质量上都无法执行原始的排列重要性方法。 该算法不仅提供了更好的特征子集,而且还可以同时提供最准确和一致的全局特征等级,也可用于模型推断。 与原始R包(将用户限制为随机森林模型)不同,BorutaShap允许用户在特征选择过程中选择任何基于树的学习器作为基础模型。 尽管BorutaShap的运行时性能有所提高,但是SHAP TreeExplainer随观察次数线性增长,这使得它在处理大型数据集时非常麻烦。 为了解决这个问题,BorutaShap包含了一个采样过程,该过程使用算法每次迭代时可用数据的最小可能子采样。 它通过比较样本的隔离林产生的分布和使用ks-test的数据来找到该样本。 从实验来看,此过程可以将运行时间减少多达80%,同时
2021-12-04 08:27:22 2.15MB Python
1
DEMO 包含 5 种特征选择算法: • 顺序前向选择 (SFS) • 顺序浮动前向选择 (SFFS) •顺序向后选择(SBS) • 顺序浮动向后选择 (SFBS) • 救济F 两种CCR估算方法: • 交叉验证• 重新替换 选择最佳特征子集后,得到的分类器可用于对任何模式进行分类。 图:上图是pattern x特征矩阵左下面板是选择的功能右下图是特征选择步骤中的 CCR 曲线右侧面板是一些模式的分类结果。 该软件是使用 Matlab 7.5 和 Windows XP 开发的。 版权所有:D. Ververidis 和 C.Kotropoulos AIIA 实验室,希腊塞萨洛尼基, jimver@aiia.csd.auth.gr costas@aiia.csd.auth.gr 为了运行演示: 为了运行演示: - 需要一台装有 Windows XP 的电脑。 - 使用 Matl
2021-11-29 09:19:30 3.15MB matlab
1
IJCAI-18 阿里妈妈搜索广告转化预测亚军解决方案 -1 赛题介绍 -2 数据下载 初赛数据链接:https://share.weiyun.com/56y91Fx 密码:89kry5 复赛数据链接:https://share.weiyun.com/5HRPNUU 密码:qrs04d -3 file文件中包含 特征重要性,特征群线下测试结果,比赛攻略,答辩ppt -4 代码讲解
2021-11-28 16:48:50 4.76MB Python
1
提出一种计及历史气象数据的短期风速预测方法。首先将历史风速数据和历史气象数据作为风速预测的原始输入,采用混合特征选择(HFS)方法对输入向量进行删选,选取与预测风速强相关的变量,生成预测模型的输入特征集;然后运用异方差高斯过程回归(HGP)模型进行建模,该模型能体现风速的随机性。根据某实测风速数据进行提前1 h风速预测,结果表明所提方法能提高风速预测精度。
1
此工具箱提供二元微分进化 (BDE) 方法 举例说明了 BDE 如何使用基准数据集解决特征选择问题。 ****************************************************** ****************************************************** ********************************
2021-11-28 12:08:23 121KB matlab
1