自己编的特征选择程序,分别包括用顺序前进法(SFS),顺序后退法(SBS),增l 减r 法(l–r)、SFFS法进行选择的程序feature_selection
2022-01-08 21:49:40 5KB 特征选择
1
GMS:基于网格的运动统计信息,可实现快速,超鲁棒的功能对应 Bian等人C ++实现。 基于网格的运动统计是一种通过运动平滑封装来改善特征匹配质量的方法。 基于ORB特征匹配,平滑度约束表示为每个单元格匹配频率的统计似然性。 结果显示了实时和非常强大的功能对应。 ORB特征点(2000) GMS之后 ORB特征点(2000) GMS之后 跑步 此实现需要 mkdir build && make ./GMS
2021-12-26 11:26:28 23.06MB opencv statistics motion feature-selection
1
房屋价格预测 艾姆斯住房数据集摘自kaggle竞赛。 该项目的目的是预测Boston Housing Dataset中房屋的房价。 提供了两个文件,即训练和测试,并且要估计测试数据的价格。 在这里,我已使用XGBoost进行预测。 感谢Krish Naik制作了这些精彩的视频,以帮助他们理解和实施房价预测。 稍后,我将添加探索性数据分析,并将XGBoost模型的结果与其他回归技术进行比较。 房价预测步骤 加载数据中 数据探索2.1具有空值的特征2.2数值特征 2.2.1 Year Features 2.2.2 Discrete Features 2.2.3 Continous Features 2.3分类特征 数据清理 数据转换4.1稀有分类特征处理 基本模型性能(XGBoost) 超参数调整 最终模型 可视化结果 1.加载数据 df = pd . read_csv
1
SGX-Full-OrderBook-Tick-Data-Trading-Strategy:使用数据科学方法(机器学习)在完整的订单簿记号数据上提供高频交易(HFT)策略的解决方案
2021-12-19 10:30:34 13.26MB python machine-learning trading feature-selection
1
(Peng et al, 2005 and Ding & Peng, 2005, 2003) 中的 mRMR(最小冗余最大相关)特征选择方法的两个源代码文件,其优于传统顶级方法的性能已在最近出版物中的数据集数量。 该版本使用互信息作为计算变量(特征)之间相关性和冗余的代理。 其他变化,例如使用相关性或 F 检验或距离,也可以在此框架内轻松实现。 Hanchuan Peng、Fuhui Long 和 Chris Ding,“基于互信息的特征选择:最大依赖、最大相关和最小冗余的标准”, IEEE 模式分析和机器智能汇刊, 卷。 27, No. 8, pp.1226-1238, 2005。 Ding C. 和 Peng HC,“微阵列基因表达数据的最小冗余特征选择”,《生物信息学与计算生物学杂志》, 卷。 3, No. 2, pp.185-205, 2005。 Ding,C 和 Peng
2021-12-17 16:39:29 3KB matlab
1
FeatureSelectionGA 使用遗传算法(DEAP框架)进行特征选择 数据科学家发现,很难选择合适的功能来获得最大的准确性,尤其是当您要处理很多功能时。 有多种选择正确功能的方法。 但是,如果特征空间真的很大,我们将不得不为之奋斗。 遗传算法是一种从其他特征中搜索最佳特征集之一以获得高精度的解决方案。 安装: $ pip install feature-selection-ga 说明文件: 用法: from sklearn . datasets import make_classification from sklearn import linear_model from feature_selection_ga import FeatureSelectionGA , FitnessFunction X , y = make_classification ( n_samp
1
该工具箱提供了蚁群系统(ACS)方法 举例说明了 ACS 如何使用基准数据集解决特征选择问题。 ****************************************************** ****************************************************** **********************************
2021-12-09 14:24:52 121KB matlab
1
使用机器学习识别欺诈(项目概述) 项目目标 在2000年,安然(Enron)是美国最大的公司之一。 到2002年,由于广泛的公司欺诈行为,该公司破产了。 在最终的联邦调查中,大量的通常是机密信息被输入到公共记录中,包括成千上万的电子邮件和高级管理人员的详细财务数据。 这些数据已与手工生成的欺诈案件中感兴趣的人的名单相结合,这意味着被起诉,与政府达成和解或辩诉交易或作证以换取起诉豁免权的个人。 这些数据为146名员工创建了21个要素的数据集。 该项目的范围是创建一种算法,该算法能够识别可能实施欺诈的安然员工。 为了实现此目标,部署了探索性数据分析和机器学习以从异常值中清除数据集,识别新参数并将
1
AutoBlur_CNN_Features 基于以下代码: : 脚本,用于提取具有不同ConvNet的CNN深度特征,然后将其用于具有线性核的SVM分类器的图像分类任务,涉及以下小型数据集:足球[1],飞鸟[2],17flowers [3],ImageNet-6Weapons [4]和ImageNet-7节肢动物[4]。 使用VGG16提取的功能或MobileNet进入SVM分类器。 允许比较使用完整图像或使用AutoBlur方法过滤之间的差异 随代码一起提供了Soccer数据集,因此可以轻松对其进行测试: 足球:原始图像 SoccerAutoBlurBB:应用AutoBlur过滤技术并使用相应的边界框裁剪后的原始图像 参考: [1]范德·韦耶尔(J. van de Weijer),施密德(C. Schmid),着色局部特征提取,Proc.Natl.Acad.Sci.USA。
1
描述: 用于以下基于MI的特征选择方法的代码(Matlab / C ++ Mex): - 最大相关性 (maxRel) - 最小冗余最大相关性(MRMR) - 最小冗余 (minRed) - 二次编程特征选择 (QPFS) - 互信息商(MIQ) - 最大相关最小总冗余 (MRMTR) 或扩展 MRMR (EMRMR) - 光谱松弛全局条件互信息 (SPEC_CMI) - 条件互信息最小化 (CMIM) - 条件 Infomax 特征提取 (CIFE) 参考: [1] Nguyen X. Vinh、Jeffrey Chan、Simone Romano 和 James Bailey,“基于互信息的特征选择的有效全局方法”。 2014 年 8 月 24 日至 27 日在纽约市举行的第 20 届 ACM SIGKDD 知识发现和数据挖掘会议 (KDD'14) 上发表。
2021-11-11 18:29:29 64KB matlab
1