不平衡学习:一种解决机器学习中不平衡数据集问题的Python程序包
2023-02-13 20:23:36 314KB python data-science machine-learning statistics
1
人工智能-非平衡学习场景下的深度神经网络研究.pdf
用于单层前馈神经网络(SLFN)的极限学习机(ELM)是一种强大的机器学习技术,并且以其快速的学习速度和良好的泛化性能而受到关注。 最近,提出了加权ELM来处理具有不平衡类分布的数据。 加权ELM的关键本质是为每个训练样本分配了额外的权重。 尽管提供了一些经验加权方案,但是如何确定更好的样本权重仍然是一个悬而未决的问题。 在本文中,我们提出了一种Boosting加权ELM,它将加权ELM无缝地嵌入到经过修改的AdaBoost框架中,以解决上述问题。 直观地,反映训练样本重要性的AdaBoost框架中的分布权重被输入到加权ELM中作为训练样本权重。 此外,在两个方面对AdaBoost进行了修改,以更有效地实现不平衡学习:(i)初始分布权重设置为不对称,以便AdaBoost以更快的速度收敛; (ii)针对不同类别分别更新分配权重,以避免破坏分配权重的不对称性。 对KEEL存储库中的16个二进制数据集和5个多类数据集的实验结果表明,与加权ELM相比,该方法可以实现更均衡的结果。
2021-12-28 15:24:50 559KB Extreme learning machine; Weighted
1
用于不平衡学习的SMOTE变量 介绍 该软件包实现了综合少数族裔过采样技术(SMOTE)的85个变体。 除了实现之外,还提供了易于使用的模型选择框架,以能够对未见数据集的过采样技术进行快速评估。 所实现的技术: [Borderline_SMOTE1] , [Borderline_SMOTE2] , [ADASYN] , [AHC] , [LLE_SMOTE] , [distance_SMOTE] , [单加氧酶] , [polynom_fit_SMOTE] , [Stefanowski ] , [ADOMS] , [Safe_Level_SMOTE] , [MSMOTE] , [DE_oversampling] , [SMOBD] , [SUNDO] , [MSYN] , [SVM_balance] , [TRIM_SMOTE] , [SMOTE_RSB] , [ProWSyn]
1
smote的matlab代码用于不平衡学习的自适应合成采样方法 ADASYN 是一个 python 模块,它为倾斜的数据集实现了自适应过采样技术。 许多机器学习算法在处理大量倾斜的数据集时遇到困难。 如果您的数据集有 1000 个示例,其中 950 个属于 'Haystack' 类,其余 50 个属于类 'Needle',则很难预测属于 'Needle' 的新数据。 该算法的作用是通过向现有示例添加一些半随机噪声来创建属于少数类的新人工数据。 有关更多信息,请阅读全文 依赖关系 pip(安装时需要) 麻木 scipy scikit 学习 安装 要使用 ADASYN,您需要运行以下命令: pip install git+https://github.com/stavskal/ADASYN 安装软件包后,您可以继续使用: from adasyn import ADASYN adsn = ADASYN(k=7,imb_threshold=0.6, ratio=0.75) new_X, new_y = adsn.fit_transform(X,y) # your imbalanced data
2021-09-05 15:33:58 207KB 系统开源
1
smote的matlab代码基于 K-Means 和 SMOTE 的不平衡学习过采样 K-Means SMOTE 是一种针对类不平衡数据的过采样方法。 它通过在输入空间的安全和关键区域生成少数类样本来帮助分类。 该方法避免了噪声的产生,有效地克服了类之间和类内的不平衡。 该项目是 k-means SMOTE 的 Python 实现。 它与 scikit-learn-contrib 项目兼容。 安装 依赖关系 该实现在 python 3.6 下进行了测试,并与最新版本的不平衡学习框架一起使用: 不平衡学习 (>=0.4.0, =1.13, =0.19.0, <0.21) 安装 皮皮 pip install kmeans-smote 从源头 克隆这个存储库并运行 setup.py 文件。 使用以下命令从 GitHub 获取副本并安装所有依赖项: git clone https://github.com/felix-last/kmeans_smote.git cd kmeans-smote pip instal
2021-08-19 10:48:32 14KB 系统开源
1
HDDT不平衡数据集,非常适合做不平衡数据及的挖掘以及分类研究,数据集中包含石油等各行各业的真是数据集的搜集。
2021-03-30 18:30:36 62.95MB 不平衡学习 不平衡数据集
1
源码源自mathworks文件交换中心,优于SMOTE的非平衡学习算法。(有意免金币,但无法设置)
2019-12-21 21:15:01 6KB 机器学习 非平衡学习
1