本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练.实验表明,核SMOTE方法所合成的样本质量高于SMOTE算法,从而有效提高SVM在非平衡数据集上的分类效果.
2024-05-20 16:31:07 531KB 支持向量机;
1
分布最优平衡分层交叉验证 (DOB-SCV) 将数据集划分为 n 折,这样,除了基于标签的分层之外,还可以为每个类维护特征空间中的平衡分布。 使用 DOB-SCV 而不是分层交叉验证的实际效果是稍微提高了测试准确性。 最大的改进可以预期在小的、类别不平衡的数据集上。 该实现可用作CVPARTITION的直接替代。 参考:关于分区诱导的数据集偏移对 k 折交叉验证的影响的研究,可从https://ieeexplore.ieee.org/document/6226477 获得
2023-12-25 19:41:11 2KB matlab
1
不平衡数据在分类时往往会偏向"多数",传统过采样生成的样本不能较好的表达原始数据集分布特征.改进的变分自编码器结合数据预处理方法,通过少数类样本训练,使用变分自编码器的生成器生成样本,用于以均衡训练数据集,从而解决传统采样导致的不平衡数据引起分类过拟合问题.我们在UCI四个常用的数据集上进行了实验,结果表明该算法在保证准确率的同时提高了F_measure和G_mean.
2023-10-30 10:20:07 3.33MB 不平衡数据 分类 变分自编码器 过采样
1
针对传统的过采样算法在增加样本的同时可能使决策域变小和噪声点增加的问题进行了研究,提出了一种基于错分的混合采样算法。该算法是以SVM为元分类器,AdaBoost算法进行迭代,对每次错分的样本点根据其空间近邻关系,采取一种改进的混合采样策略:对噪声样本直接删除;对危险样本约除其近邻中的正类样本;对安全样本则采用SMOTE算法合成新样本并加入到新的训练集中重新训练学习。在实际数据集上进行实验,并与SMOTE-SVM和AdaBoost-SVM-OBMS算法进行比较,实验结果表明该算法能够有效地提高负类的分类准确率。
1
处理不平衡数据分类时,传统支持向量机技术(SVM)对少数类样本识别率较低。鉴于SVM+技术能利用样本间隐藏信息的启发,提出了多任务学习的不平衡SVM+算法(MTL-IC-SVM+)。MTL-IC-SVM+基于SVM+将不平衡数据的分类表示为一个多任务的学习问题,并从纠正分类面的偏移出发,分别赋予多数类和少数类样本不同的错分惩罚因子,且设置少数类样本到分类面的距离大于多数类样本到分类面的距离。UCI数据集上的实验结果表明,MTL-IC-SVM+在不平衡数据分类问题上具有较高的分类精度。
2023-03-04 20:08:56 1.03MB 不平衡数据 支持向量机 SVM+
1
不平衡学习:一种解决机器学习中不平衡数据集问题的Python程序包
2023-02-13 20:23:36 314KB python data-science machine-learning statistics
1
smote的matlab代码ND DIAL:不平衡算法 用于不平衡学习的基于 Python 的极简算法实现。 包括深度和表征学习算法(通过 TensorFlow 实现)。 下面是当前实现的方法的列表。 欠采样 带/不带替换的随机多数欠采样 过采样 SMOTE - 合成少数过采样技术 DAE - 去噪自编码器 ( TensorFlow ) GAN - 生成对抗网络 ( TensorFlow ) VAE - 变分自动编码器( TensorFlow ) 集成采样 RAMOBoost RUSBoost SMOTEBoost 参考: : NV Chawla、KW Bowyer、LO Hall 和 P. Kegelmeyer。 “SMOTE:合成少数过采样技术。” 人工智能研究杂志 (JAIR),2002。 :P. Vincent、H. Larochelle、I. Lajoie、Y. Bengio 和 P.-A. 曼扎戈尔。 “堆叠降噪自动编码器:在具有局部降噪标准的深度网络中学习有用的表示”。 机器学习研究杂志 (JMLR),2010 年。 :IJ Goodfellow、J. Pouget-Ab
2022-10-08 10:58:36 28KB 系统开源
1
针对现实中交通正常运行状态远多于事件状态这一事实,提出了面向不平衡数据集的交通事件检测算法。运用SMOTE (Synthetic Minority Over-sampling Technique)算法重构训练集,使之平衡,以支持向量机(Support Vector Machine ,SVM)作为分类器,对交通事件进行检测。使用美国I-880高速公路获取的交通数据进行算法的训练和性能测试。结果表明,基于SMOTE-SVM的交通事件自动检测(Automatic Incident Detection , AID
2022-09-17 14:18:43 1.24MB 自然科学 论文
1
摘要I第一章 绪论 11.1 研究背景及意义 11.2 国内外研究动态 21.3 论文结构 3第二章 支持向量机理论基础 52.1 引言52.2 统计学习理论
2022-08-04 21:00:31 15.39MB 支持向量机
1
SMOTE算法在不平衡数据中的应用.pdf
2022-07-09 19:09:04 793KB 文档资料