安然欺诈项目 休斯顿的安然综合体- 安然是美国最大的公司之一。 由于公司欺诈,它破产了。 由于联邦调查的结果,大量的安然数据(电子邮件和财务数据)已进入公共记录。 该项目旨在建立一个分类器,该分类器可以基于公共的安然财务和电子邮件数据集来预测安然员工涉及欺诈的情况。 有关安然丑闻的更多详细信息,请参见 。 工作流程 该项目分为3个主要阶段: 功能选择和工程 算法选择 选型 特征选择与工程 首先,清理数据; 由于我们对个人数据感兴趣,因此删除了与“总计”和“公园旅行社”相对应的数据。 另外,“ LOCKHART EUGENE E”数据全为零,并且也被删除。 一些功能也被删除。 由于“ to
2021-11-21 19:00:23 2.77MB python machine-learning random-forest scikit-learn
1
用于特征选择的遗传算法 运行算法: 步骤 1:运行 GA.m 文件 您可以将交叉、变异、分类器和数据集替换为您选择的那些。 如果您发现错误,请给我们发电子邮件。 Sadegh Salesi sadegh.salesi@my.ntu.ac.uk Georgina Cosma 博士 georgina.cosma@ntu.ac.uk 参考:S. Salesi 和 G. Cosma,“一种用于特征选择的新型扩展二进制布谷鸟搜索算法”,2017 年第二届知识工程与应用国际会议 (ICKEA),伦敦,2017 年,第 6-12 页。 doi:10.1109/ICKEA.2017.8169893 网址: http : //ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8169893&isnumber=8169886
2021-11-16 15:27:07 9.57MB matlab
1
Jx-FFST:过滤器特征选择工具箱 -------------------------------------------------- -------------------------------------------------- -------------------------------------------------- ------------- * 此工具箱包含 4 种过滤器特征选择方法 * 显示了如何在基准数据集上使用这些过滤器功能选择的示例 * 这个 Jx-WFST 工具箱的详细信息可以在https://github.com/JingweiToo/Filter-Feature-Selection-Toolbox找到
2021-11-13 23:16:43 62KB matlab
1
主要为大家详细介绍了python实现求特征选择的信息增益,可以同时适用于二值离散型和连续型的属性,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
2021-11-13 19:35:40 32KB python 特征选择 信息增益
1
ReliefF算法实现特征选择C++源码
2021-11-12 20:51:16 8.87MB ReliefF 源码 C++
1
斯克莱恩遗传 scikit-learn的遗传特征选择模块 遗传算法模仿自然选择的过程,以搜索函数的最佳值。 安装 安装sklearn-genetic的最简单方法是使用pip pip install sklearn-genetic 或conda conda install -c conda-forge sklearn-genetic 要求 Python> = 2.7 scikit学习> = 0.20.3 深度> = 1.0.2 例子 from __future__ import print_function import numpy as np from sklearn import datasets , linear_model from genetic_selection import GeneticSelectionCV def main (): iris = dat
2021-11-12 20:34:51 24KB Python
1
描述: 用于以下基于MI的特征选择方法的代码(Matlab / C ++ Mex): - 最大相关性 (maxRel) - 最小冗余最大相关性(MRMR) - 最小冗余 (minRed) - 二次编程特征选择 (QPFS) - 互信息商(MIQ) - 最大相关最小总冗余 (MRMTR) 或扩展 MRMR (EMRMR) - 光谱松弛全局条件互信息 (SPEC_CMI) - 条件互信息最小化 (CMIM) - 条件 Infomax 特征提取 (CIFE) 参考: [1] Nguyen X. Vinh、Jeffrey Chan、Simone Romano 和 James Bailey,“基于互信息的特征选择的有效全局方法”。 2014 年 8 月 24 日至 27 日在纽约市举行的第 20 届 ACM SIGKDD 知识发现和数据挖掘会议 (KDD'14) 上发表。
2021-11-11 18:29:29 64KB matlab
1
国际金融服务中心 基于并行化互信息的特征选择模块。 相关博客文章 依赖关系 scipy(>=0.17.0) numpy(>=1.10.4) scikit-learn(>=0.17.1) 瓶颈(>=1.1.0) 如何使用 像使用任何其他 scikit-learn 方法一样下载、导入和执行以下操作: fit(X, y) transform(X) fit_transform(X, y) 描述 MIFS 代表基于互信息的特征选择。 此类包含使用连续和离散 y 变量选择特征的例程。 实现了三种选择算法:JMI、JMIM 和 MRMR。 此实现尝试模仿 scikit-learn 接口,因此使用 fit、transform 或 fit_transform 来运行特征选择。 有关示例和用法,请参阅 examples/example.py。 文档 参数 方法:字符串,默认 = 'JMI':
2021-11-09 18:25:57 21KB Python
1
该工具箱提供了Salp Swarm算法(SSA)方法 “主”脚本说明了SSA如何使用基准数据集解决特征选择问题的示例。 ****************************************************** ****************************************************** ******************************
2021-11-09 10:24:23 121KB matlab
1
PSO功能选择 用于特征选择的粒子群优化(PSO)。 使用PySwarm。
2021-11-07 20:26:46 75KB JupyterNotebook
1