近几十年来,人们生活水平显著提高,但是健康意识依旧薄弱,不良的生活习惯和饮食习惯导致糖尿病发病人数急剧增加,由糖尿病导致的各种并发症严重威胁了人们的健康.由于糖尿病具有知晓率低的特点,很多糖尿病患者未能及时发现病症,导致出现并发症.本文通过分析糖尿病的特点,针对医疗数据样本量小、容易缺失的特点,选择IV值分析进行特征选择、使用一种新型的Boosting算法CatBoost进行糖尿病患者预测,取得了显著的预测效果.
2021-12-05 17:36:46 853KB 糖尿病 IV值分析 特征选择 集成学习
1
针对模式识别时原始特征数量大而有冗余的现象,提出了一种基于遗传退火算法的特征选优方法,首先对遗传算法和模拟退火做了简要评论,然后在遗传算法中引入模拟退火的 Boltzmann 更新机制,以克服传统的遗传算法易于过早收敛和易于陷入局部极小的问题,最后阐述、设计了适应度函数和遗传算子。仿真实验表明,该方法在求解的效率和解的质量方面都达到了令人满意的效果。
1
三种常用的特征选择算法 卡方特征选择,互信息特征选择,信息增益特征选择(CHI,MI,IG) (Three kinds of commonly used feature selection algorithm, CHI, MI, IG)
2021-12-05 10:36:57 1KB 特征选择
1
博鲁塔沙普 BorutaShap是一种包装器特征选择方法,它结合了Boruta特征选择算法和Shapley值。 事实证明,这种组合在速度和生成的特征子集的质量上都无法执行原始的排列重要性方法。 该算法不仅提供了更好的特征子集,而且还可以同时提供最准确和一致的全局特征等级,也可用于模型推断。 与原始R包(将用户限制为随机森林模型)不同,BorutaShap允许用户在特征选择过程中选择任何基于树的学习器作为基础模型。 尽管BorutaShap的运行时性能有所提高,但是SHAP TreeExplainer随观察次数线性增长,这使得它在处理大型数据集时非常麻烦。 为了解决这个问题,BorutaShap包含了一个采样过程,该过程使用算法每次迭代时可用数据的最小可能子采样。 它通过比较样本的隔离林产生的分布和使用ks-test的数据来找到该样本。 从实验来看,此过程可以将运行时间减少多达80%,同时
2021-12-04 08:27:22 2.15MB Python
1
DEMO 包含 5 种特征选择算法: • 顺序前向选择 (SFS) • 顺序浮动前向选择 (SFFS) •顺序向后选择(SBS) • 顺序浮动向后选择 (SFBS) • 救济F 两种CCR估算方法: • 交叉验证• 重新替换 选择最佳特征子集后,得到的分类器可用于对任何模式进行分类。 图:上图是pattern x特征矩阵左下面板是选择的功能右下图是特征选择步骤中的 CCR 曲线右侧面板是一些模式的分类结果。 该软件是使用 Matlab 7.5 和 Windows XP 开发的。 版权所有:D. Ververidis 和 C.Kotropoulos AIIA 实验室,希腊塞萨洛尼基, jimver@aiia.csd.auth.gr costas@aiia.csd.auth.gr 为了运行演示: 为了运行演示: - 需要一台装有 Windows XP 的电脑。 - 使用 Matl
2021-11-29 09:19:30 3.15MB matlab
1
IJCAI-18 阿里妈妈搜索广告转化预测亚军解决方案 -1 赛题介绍 -2 数据下载 初赛数据链接:https://share.weiyun.com/56y91Fx 密码:89kry5 复赛数据链接:https://share.weiyun.com/5HRPNUU 密码:qrs04d -3 file文件中包含 特征重要性,特征群线下测试结果,比赛攻略,答辩ppt -4 代码讲解
2021-11-28 16:48:50 4.76MB Python
1
提出一种计及历史气象数据的短期风速预测方法。首先将历史风速数据和历史气象数据作为风速预测的原始输入,采用混合特征选择(HFS)方法对输入向量进行删选,选取与预测风速强相关的变量,生成预测模型的输入特征集;然后运用异方差高斯过程回归(HGP)模型进行建模,该模型能体现风速的随机性。根据某实测风速数据进行提前1 h风速预测,结果表明所提方法能提高风速预测精度。
1
此工具箱提供二元微分进化 (BDE) 方法 举例说明了 BDE 如何使用基准数据集解决特征选择问题。 ****************************************************** ****************************************************** ********************************
2021-11-28 12:08:23 121KB matlab
1
情绪分类 基于 EEG 情绪分类的依赖最大化特征选择。 该项目已作为 IIT 德里 2014 年秋季学期神经网络课程的一部分完成。 主管:Jayadeva博士 作者 Rishi Dua T Veeranjaneya Ashok 安装 安装 Python 和 scikit 将 DEAP 数据集(cPickle 预处理)复制到 data/raw 文件夹 运行脚本.sh 文档 请参阅 docs/readme.pdf 贡献 源代码: : 执照 该项目是根据 MIT 许可条款获得许可的。 有关详细信息,请参阅 LICENSE.txt
2021-11-24 22:00:17 156KB Python
1
本资源是matlab特征选择特征选择函数库,包含大量的特征选择所需的源码,包括 relieff, ILFS等,需要的可以下载,此版本带有license。
2021-11-23 19:16:30 1.18MB featur
1