smote的matlab代码
高斯噪声回归的合成少数过采样技术
描述
用于高斯噪声回归的合成少数过采样技术
(SMOGN)
的
Python
实现。
使用传统插值以及引入高斯噪声
(SMOTER-GN)
进行回归的合成少数过采样技术
(SMOTER)。
根据给定观察结果的
KNN
距离在两种过采样技术之间进行选择。
如果距离足够近,则应用
SMOTER。
如果距离太远,则应用
SMOTER-GN。
适用于回归适用的预测问题,但用于预测的值很少或不常见。
这也可以作为对倾斜响应变量进行日志转换的有用替代方法,尤其是在生成合成数据也很有趣的情况下。
特征
唯一的开源
Python
支持版本的合成少数回归过采样技术。
支持包含混合数据类型的
Pandas
DataFrame
输入、按数据类型自动选择距离度量以及可选的自动删除缺失值。
灵活的输入可用于在连续响应变量和友好参数内控制感兴趣的区域,以对合成数据进行过采样。
纯粹的
Pythonic,为一致性、可维护性和未来改进而开发,没有原始
R
实现中包含的对
C
或
Fortran
的外部函数调用。
要求
Python
3
NumPy
熊猫
2021-11-15 20:22:45
566KB
系统开源
1