上传者: 42143092
|
上传时间: 2021-12-03 19:33:17
|
文件大小: 1.02MB
|
文件类型: -
IEEE-CIS-欺诈检测
该存储库包含有关IEEE-CIS欺诈检测数据集的深入探索探索性数据分析(EDA)。竞争是一个二进制分类问题-即我们的目标变量是一个二进制属性(用户是否使点击欺诈?),我们的目标是尽可能将用户分类为“欺诈”或“非欺诈”。
您可以阅读IEEE-CIS欺诈检测页面中的完整数据集概述和数据描述。
在此存储库中,您可以访问;
EDA.ipynb:包含深入分析的Jupyter笔记本
util_data_cleaning.py:包含大量数据清除功能的Python文件。
util_reporting.py:包含大量可视化和报告功能的Python文件。
util_feature_engineering.py:包含大量数据准备和整理功能的Python文件。
您可以看一下我的Kaggle内核,以了解如何简化EDA流程: