使用机器学习在Python项目中进行信用卡欺诈检测仍在进行中
语境
信用卡公司必须能够识别出欺诈性的信用卡交易,以免向客户收取未购买商品的费用,这一点很重要。
内容
数据集包含2013年9月欧洲持卡人通过信用卡进行的交易。 该数据集显示了两天内发生的交易,在284,807笔交易中,我们有492起欺诈。 数据集高度不平衡,阳性类别(欺诈)占所有交易的0.172%。
它仅包含数字输入变量,它们是PCA转换的结果。 遗憾的是,由于机密性问题,我们无法提供有关数据的原始功能和更多背景信息。 功能部件V1,V2,…,V28是使用PCA获得的主要组件,唯一尚未使用PCA转换的功能部件是“时间”和“量”。 功能“时间”包含数据集中每个事务和第一个事务之间经过的秒数。 功能“金额”是交易金额,此功能可用于与示例相关的成本敏感型学习。 特征“类别”是响应变量,在发生欺诈时其值为1,否则为0
灵感
识别欺诈
1