使用机器学习的信用卡欺诈检测
信用卡欺诈是一个日益严重的问题,面临许多挑战,包括时间漂移和严重的阶级失衡。 该项目尝试使用包括自适应合成采样方法(ADASYN)和合成少数采样率(SMOTE)在内的最新技术来解决班级不平衡问题。 2013年9月在欧洲进行的超过280k真实交易[1]被用作训练数据集。 比较了三种类型的机器学习模型:随机森林,支持向量机和多层感知器。 结果表明,不平衡数据集的最佳采样方法取决于数据集和所使用的模型。
该项目包含以下组件:
a)PDF格式的IEEE风格论文
b)Jupyter Notebook进行了机器学习测试。 您可以运行视图并自己运行它们。 还包括注释,推理和数字。 为了方便起见,我在此git repo中包含了原始数据集的副本[1],但是请参考原始资源以获取最新版本。
该项目是2017年冬季在滑铁卢大学进行的SYDE 522:机器学习的一部分。
安装
克隆项目:
$ git clone https://github.com/yazanobeidi/fraud-detection.git && cd fraud-detection
Pip安装依赖项
1