作者:安德烈·维特(Andre Veit)
领英(LinkedIn): :
电子邮件:
信用卡欺诈检查
不平衡数据的分类和异常检测
关于本笔记本
欺诈并不是什么新鲜事物,事实上,据《您的钱》网站称,第一个欺诈记录发生在公元前300年。 如今,在互联网和数字化以惊人的速度增长的世界中,每天都通过网络实现数百万笔交易和其他操作。 这意味着欺诈者有很多机会。
幸运的是,相对而言很少。 不幸的是……这个事实使他们很难被抓住。
本笔记本的目的是探索几种处理异常检测和高度不平衡的数据集的方法。
概述:
数据探索与准备
无监督学习-异常检测
2.1。 隔离林2.2。 局部离群因子
监督学习-分类
3.1。 逻辑回归3.2。 随机森林3.3。 支持向量机
自动编码器-无监督和半监督学习
4.1。 无监督学习4.2。 半监督学习
数据集
该数据集来自Kaggle网站,可以通过以下链接找到:
1