所有ML算法 它包括所有ML模型。(用于KTM和银行数据) 由所有ML预处理技术组成,如a。 采样技术(欠采样,过采样-ROS和SMOTE)b。 交叉验证(K折,分层K折)c。 主成分分析 具有HYPER参数校正的Boston数据集的套索和岭回归。 该存储库还包含我在编码文件中使用的RAW数据文件
2021-12-11 01:12:55 577KB JupyterNotebook
1
smote的matlab代码不平衡数据问题 在机器学习中,我们经常会遇到不平衡的数据。 例如,在银行的信用数据中,97% 的客户可以按时还款,而只有 3% 的客户不能。 如果我们忽略 3% 无法按时付款的客户,模型的准确率可能仍然很高,但可能会给银行带来巨大的损失。 因此,我们需要适当的方法来平衡数据。 许多研究论文提供了许多技术,包括过采样和欠采样,以处理数据不平衡。 该存储库实现了其中一些技术。 要求 sklearn numpy SMOTE SMOTE 是 NV Chawla、KW Bowyer、LO Hall 和 WP Kegelmeyer 的论文中提到的一种合成少数过采样技术 Parameters ---------- sample 2D (numpy)array minority class samples N Integer amount of SMOTE N% k Integer number of nearest neighbors k k <= number of minority class samples Attributes ---------- newInde
2021-12-11 00:04:28 155KB 系统开源
1
用于不平衡学习的SMOTE变量 介绍 该软件包实现了综合少数族裔过采样技术(SMOTE)的85个变体。 除了实现之外,还提供了易于使用的模型选择框架,以能够对未见数据集的过采样技术进行快速评估。 所实现的技术: [Borderline_SMOTE1] , [Borderline_SMOTE2] , [ADASYN] , [AHC] , [LLE_SMOTE] , [distance_SMOTE] , [单加氧酶] , [polynom_fit_SMOTE] , [Stefanowski ] , [ADOMS] , [Safe_Level_SMOTE] , [MSMOTE] , [DE_oversampling] , [SMOBD] , [SUNDO] , [MSYN] , [SVM_balance] , [TRIM_SMOTE] , [SMOTE_RSB] , [ProWSyn]
1
smote的matlab代码 高斯噪声回归的合成少数过采样技术 描述 用于高斯噪声回归的合成少数过采样技术 (SMOGN) 的 Python 实现。 使用传统插值以及引入高斯噪声 (SMOTER-GN) 进行回归的合成少数过采样技术 (SMOTER)。 根据给定观察结果的 KNN 距离在两种过采样技术之间进行选择。 如果距离足够近,则应用 SMOTER。 如果距离太远,则应用 SMOTER-GN。 适用于回归适用的预测问题,但用于预测的值很少或不常见。 这也可以作为对倾斜响应变量进行日志转换的有用替代方法,尤其是在生成合成数据也很有趣的情况下。 特征 唯一的开源 Python 支持版本的合成少数回归过采样技术。 支持包含混合数据类型的 Pandas DataFrame 输入、按数据类型自动选择距离度量以及可选的自动删除缺失值。 灵活的输入可用于在连续响应变量和友好参数内控制感兴趣的区域,以对合成数据进行过采样。 纯粹的 Pythonic,为一致性、可维护性和未来改进而开发,没有原始 R 实现中包含的对 C 或 Fortran 的外部函数调用。 要求 Python 3 NumPy 熊猫
2021-11-15 20:22:45 566KB 系统开源
1
针对少数类样本合成过采样技术(synthetic minority over-sampling technique,SMOTE)在合成少数类新样本时会带来噪声问题,提出了一种改进降噪自编码神经网络不平衡数据分类算法(SMOTE-SDAE)。该算法通过SMOTE方法合成少数类新样本以均衡原始数据集,考虑到合成样本过程中会产生噪声的影响,利用降噪自编码神经网络算法的逐层无监督降噪学习和有监督微调过程,有效实现对过采样数据集的降噪处理与数据分类。在UCI不平衡数据集上实验结果表明,相比传统SVM算法,该算法显著提高了不平衡数据集中少数类的分类精度。
2021-11-07 21:56:09 1.47MB 神经网络 过采样 不平衡数据 分类
1
MSP430单片机AD过采样率的思考 TI手册上这个滤波器和过采样率的设置,讲的比较含糊,希望这个文档能对大家有用。
2021-11-05 10:05:29 105KB MSP430 SD16 AD 过采样率
1
过采样算法 SMOTEFUNA 的 Matlab 实现,原始论文可在此处获得: https ://ieeexplore.ieee.org/document/9045990。 请如果您在任何项目中使用此方法,请不要忘记引用原始文章: Tarawneh, Ahmad S., 等。 “SMOTEFUNA:基于最远邻算法的合成少数过采样技术。” IEEE 访问 8 (2020):59069-59082。
2021-11-04 21:56:27 2KB matlab
1
这组文件可用于构建具有近乎完美重构的多相滤波器组。 滤波器组使用两个均匀调制的 DFT 滤波器组实现,这些滤波器组频移 1/2 通道宽度。 有效地,使用了两次过采样。 通道数必须是 2 的倍数。 可以自由选择每个通道的抽头数。 提供了用于设计原型过滤器的脚本,该脚本基于“root-raised-error-function”。 原型具有完全线性的相位。 每通道 128 个抽头,可实现 -300 dB 的平均重建误差。 相邻通道的通道分离度优于150 dB,相距较远的通道的通道分离度优于300 dB。 处理速度约为 200 kSamples/秒,对于 32 个抽头/通道,与通道数量无关。 有了足够的内存,大量的通道(例如 64K)是可行的。
2021-10-27 00:51:45 4KB matlab
1
详细描述了过采样、欠采样的原理,并就实际工程应用给出了2者的对比。
2021-09-28 10:23:08 1.19MB 欠采样定理
1
过采样(处理数据不平衡问题)-附件资源
2021-09-01 19:59:07 106B
1