数据集介绍
相关项目——1:https://aistudio.baidu.com/aistudio/projectdetail/2286726
相关项目——2:https://aistudio.baidu.com/aistudio/projectdetail/2307043
其中训练集样本约59万(欺诈占3.5%),测试集样本约50万。
数据主要分为2类,交易数据transaction和identity数据。
字段表
交易表
Field Description
TransactionDT:来自给定参考日期时间的时间增量(不是实际时间戳)
TransactionAMT:以美元为单位的交易支付金额
ProductCD:产品代码,每笔交易的产品
card1 - card6:支付卡信息,如卡类型、卡类别、发卡行、国家等
addr:地址
dist:距离
P_ 和 (R__) emaildomain:购买者和收件人的电子邮件域
C1-C14:计数,如发现有多少地址与支付卡关联等,实
D1-D15:timedelta,例如上次交易之间的天数等
M1-M9:匹配,如卡上的姓名和地址等
Vxxx:Vesta 设计了丰富的功能,包括排名、计数和其他实体关系
分类特征:
ProductCD
card1 - card6
addr1, addr2
P_emaildomain
R_emaildomain
M1 - M9
身份表
该表中的变量是身份信息——与交易相关的网络连接信息(IP、ISP、代理等)和数字签名(UA/浏览器/操作系统/版本等)。
它们由 Vesta 的欺诈保护系统和数字安全合作伙伴收集。
(字段名称被屏蔽,不提供成对字典用于隐私保护和合同协议)
分类特征:
DeviceType
DeviceInfo
id_12 - id_38
2025-12-26 16:45:54
106.97MB
数据集
1