人工智能-项目实践-创新大赛-基于python的用户贷款风险预测 融360与平台上的金融机构合作,提供了近7万贷款用户的基本身份信息、消费行为、银行还款等数据信息,需要参赛者以此建立准确的风险控制模型,来预测用户是否会逾期还款。 ##解决方案概述## 本题很多关键属性被脱敏处理,比如时间戳和所有金额的值,这个对我们进行特征构造带来很多的影响,损失了很多业务信息。不过对于参赛者都是公平的,因而我们构造了大量的统计特征,根据模型及线上反馈最佳特征大多来自用户浏览行为browse_history和bill_detail,此外发现放款时间也是个强力特征,详细见代码部分。这里只放了我个人的代码,队友的特征工程很多类似的,也有一些独特之处,这里说几个思路:bill_detail表的特征按放款时间分为放款前放款后分别统计(还可以尝试多划分几个时间窗再统计)、基于熵的分箱处理(特征离散化,熊掌整理了思路见:最优分箱.docx)、排序特征、组合特征等,有兴趣可以自己去实现。模型方面,我本人主要玩了xgboost和lightgbm,队友也基本上是xgboost、RandomForest,在玩Stack
2022-04-21 13:05:22 19.06MB 人工智能 python 贷款风险预测 风险预警
使用Java实现基于C4.5算法的决策树,实现银行贷款风险预测,包括对离散属性和连续属性的处理。适用于离散属性、连续属性共存的数据。
2021-11-05 21:56:15 6KB 机器学习 Java
1
17年 datacastle竞赛用户贷款风险预测初赛示例代码 数据的话后续在更新,也可以在csdn上联系
2021-06-26 17:40:40 4KB datacastle 机器学习 风控 竞赛
1
融360与平台上的金融机构合作,提供了近7万贷款用户的基本身份信息、消费行为、银行还款等数据信息,需要参赛者以此建立准确的风险控制模型,来预测用户是否会逾期还款。由于该比赛已结束,平台的数据已经无法下载,所以晴天在这里提供给有需要的伙伴。
1