线性回归 具有特征选择的线性回归 通过拟合独立变量和因变量之间的最佳线性关系来预测目标值。 最小二乘法:y = mx + c 简单LR:仅使用单个独立变量 多个LR:使用多个独立变量时,如果它们具有多个参数,则可以使用梯度下降来降低成本函数 指标:{some imp} MSE:预测输出与实际输出之间的平均平方距离MAE:预测输出与精算输出之间的平均距离{当存在异常值时,我们使用MAE} RMSE:MSE的平方根 代码说明: 从sklearn加载的Boston数据集 检查空值并拆分数据集 使用Extratree classsifer(){功能选择}查找功能重要性 查找特征之间的相关性 使用chi2方法选择最佳功能{selectKbest} 拟合模型 检查指标值 在这里,我们使用了3种特征选择方法来找到最合适的方法!
2021-08-17 10:03:22 287KB JupyterNotebook
1
1、提 出 网 络 加 密 流 量 识 别 的 特 征 选 择 方法 。 针 对 目 前对 网 络 加 密 流 的 识 别 需 求 以 及 对 网 络 流 加 密 原 理 和 相 关 协 议 的 分 析 , 本 文 分 别 针 对 应 用 类 型 和 内 容 型 的 识 别 提取 多 种 数据 流 特 征, 如 加 密 协 议 状 态 序 列 、 数 据 包 长 度 、 有 效 载 荷 等 , 同 时 针 对 加 密 数 据 流 的 多 阶 段 特 点- 握 手 协 商 阶 段、数 据 传 输 阶 段, 在 上 述 特 征 基 础 上 提 取 加密协 议扩 展字 段 信 息 以 及 TC P 数据 段 的 长 度 序 列, 最 后 根 据 特 征 的 不 同 形 式 利 用 不 同 的 算 法 模 型 进 行 结 果 测 试, 分 析 并 选 出 对 识 别 加 密 流 效果 最好 的 特征 。 2 、密 流 的 单任 务 识 别 现 状, 本文利 用 选 择 出 的 多 阶 段 特 征 实 现 多 任 务 的 识 别 , 且 经 过 相 关 实 验 效 果 对 比 与 多 阶 段 特征 的 可 视化 分 析 , 进 一步 提 出 针对 不 同 识 别 任 务 的 多 阶 段 特征 融 合 算 法 来 提 高 加密 流 量 的 识 别 效 果。 实 验 结 果 表 明 , 多 阶 段 特 征 的 融 合 不 仅 提 高 了 单 任 务 的 识 别 效 果, 其 识 别 结 果 的 关联 效 果 也优 于 其他方 案 对 多 任 务 的 识 别。 3 、设 计 并 实 现 了 在线 网 络 加 密 流 量 分 类 的 原 型 系 统。针 对 当 前实 时 加 密 流 量 识 别 分 类 的 需 求 , 本 文 以 上 述 多 阶 段 特 征 融 合 算 法 为 理 论 支 撑 , 提 出 在 线 加 密 流 量 识 别 系 统 的 功 能框架 。 本 文 从离线 训 练 和 在 线 识 别 角 度 阐 述 系 统 的 具 体 实 现 过 程,并 且 将 识 别 效 果 通 过 前后 端界 面 进 行 可 视 化。
降维与特征选择参考程序matlab代码.zip
2021-08-08 16:03:59 2KB matlab
adaboost进行Gabor特征的选择 文中代码可能有误 详情请参考博文:http: blog csdn net raby gyl article details 22650165
2021-08-07 11:54:09 1.83MB adaboost gabor 特征
1
05 特征优化和特征选择.ipynb
2021-08-06 09:01:39 31KB 机器学习
1
这个包是 (Peng et al, 2005 and Ding & Peng, 2005, 2003) 中的 mRMR(minimum-redundancy maximum-relevancy)特征选择方法,它比传统的 top-ranking 方法更好的性能已经在许多最近出版物中的数据集。 该版本使用互信息作为计算变量(特征)之间相关性和冗余的代理。 其他变化,例如使用相关性或 F 检验或距离,也可以在此框架内轻松实现。 Hanchuan Peng、Fuhui Long 和 Chris Ding,“基于互信息的特征选择:最大依赖、最大相关和最小冗余的标准”, IEEE 模式分析和机器智能汇刊, 卷。 27, No. 8, pp.1226-1238, 2005. [PDF] Ding C. 和 Peng HC,“微阵列基因表达数据的最小冗余特征选择”,《生物信息学与计算生物学杂志》,
2021-08-04 13:57:00 520KB matlab
1
基于局部类内类间离散度矩阵的类别可分性判据,韩绍卿,李夕海,特征选择是模式识别领域的重要问题之一。特征选择的关键在于特征子集的评价标准。对于某些类别内呈多峰分布的特征选择问题,传统
2021-08-04 11:34:33 252KB 特征选择
1
此工具箱提供二进制 Harris Hawk 优化 (BHHO) 举例说明了 BHHO 如何使用基准数据集解决特征选择问题。 ****************************************************** ****************************************************** **********************************
2021-07-26 16:38:59 121KB matlab
1
特征选择,数据挖掘,用matlab实现,General purpose FS software
2021-07-24 20:08:27 392KB SVM
1
混合互信息和粒子群算法的多目标特征选择方法_王金杰
2021-07-21 18:06:05 4.74MB pso
1