smote的matlab代码信用卡欺诈检测
在这个项目中,我们将分析包含来自
Kaggle
()
的
284,807
笔交易中的
492
笔欺诈的数据集。
这些交易是由欧洲信用卡持有人于
2013
年
9
月进行的。我们这个项目的目标是将数据集放入我们的机器学习模型中,以便在处理该数据集高度不平衡的问题的同时进行精确预测。
由于有28个变量是主成分分析(PCA)变换的结果,并且没有给出变量的信息,我们将删除具有相似分布的变量。
我们的下一步是处理不平衡的问题。
我们将使用合成少数过采样技术
(SMOTE)
对数据集进行重新采样,以使欺诈和正常交易的数量均匀。
最后一步是比较机器学习方法,我们发现
Xgboost
返回了最高的
AUC
分数。
2022-07-23 10:21:48
468KB
系统开源
1