文章目录数据集介绍代码实现1、导入需要的库2、导入数据集查看数据集中正样本(欺诈)和负样本(未欺诈)的数量对数据集进行稍微处理3、划分数据集划分训练集、验证集和测试集划分出特征和标签4、标准化处理5、查看正负样本的相关信息区分正负样本在’V5’,’V6’两个维度上比较正负样本6、构建模型7、对比:有bias_initializer vs 没有bias_initializer没有bias_initializer构建模型用模型预测前十个样本将训练集输入模型来评价模型有bias_initializer计算bias_initializer构建模型用模型预测前十个样本将训练集输入模型来评价模型8、保存初
针对传统的机器学习算法对不平衡数据集的少类分类准确率不高的问题,基于支持向量机和模糊聚类,提出一种不平衡数据加权集成学习算法。首先提出加权支持向量机模型(Weighted Support Vector Machine,WSVM),该模型根据不同类别数据所占比例的不同,为各类别分配不同的权重,然后将WSVM与模糊聚类结合提出一种新的集成学习算法。将本文提出的算法应用于人造数据集和UCI数据集实验中,实验结果表明,所提出的算法能够有效地解决不平衡数据的分类问题,具有更好的分类性能。