本项目通利用Kaggle平台predict-loan-defaulters 贷款数据,通过逻辑回归模型来对这些数据进行预测判断,构建贷款违约预测模型,建立预测模型,预测正处于贷款期间的人的违约的概率 。在贷款管理方面,如果可以通过构建量化模型对客户的信用等级进行一定的区分。得知了每个账户的违约概率后,可以预估一下未来的坏账比例,及时做好资金安排。也可以对违约概可能性较高的客户进行更加频繁的“关怀”,及时发现问题,以避免损失。 在这个量化模型中,被解释变量为二分类变量,因此需要构建一个排序类分类模型。而排序类分类模型中常使用的算法是逻辑回归。
1
基于LightGBM的网络贷款违约预测模型,人工智能预测违约
2021-11-05 10:49:09 5.11MB LightGBM 预测模型
1
赛题信息:车贷资产由于进入门槛低、借款额度低、流动性高、限期短等优点,但做好风险防控依然是行业的主要问题之一。国内某贷款机构就面临了这样的难题,该机构的借款人往往拖欠还款或拒不还款,导致该机构的不良贷款率居高不下。 数据是真实数据脱敏上传因此有很强的代表性,非常适合练手。 本次比赛的评估指标是F1,也是相当的有代表性
2021-10-14 14:04:43 10.04MB 数据分析
UCI Statlog (German Credit Data) 原始数据集
1
互联网金融LeningClub信贷数据分析项目实践 转载请注明作者和出处: Github代码获取: Python版本: Python3.6 运行环境: Win10 + Anaconda + jupyter Notebook + Sublime text3 1. 项目简介 采用了Lending Club 信用贷款违约数据是美国网络贷款平台 LendingClub 在2007-2015年间的信用贷款情况数据,主要包括贷款状态和还款信息。附加属性包括:信用评分、地址、邮编、所在州等,累计75个属性(列),890000笔 贷款(行)。 贷款违约预测模型,使用了Numpy,Pandas,Sklearn科学计算包完成数据清洗,构建特征工程,以及完成预约模型的训练,数据可视化采用了Matplotlib及Seaborn等可视化包。 2. 信贷数据分析过程 接下来,我们将利用给定的借贷数据,做一次较为完整的
2021-09-23 10:15:01 27KB JupyterNotebook
1
https://www.kaggle.com/c/loan-default-prediction
2021-09-22 18:18:45 183.41MB Kaggle creditcard 训练集
1
贷款违约预测竞赛数据【Kaggle竞赛】.zip
2021-04-26 10:00:22 581.52MB 贷款违约预测竞赛数据 Kaggle竞赛
1
本文分析了台湾某银行客户的违约支付情况,提出了基于数据挖掘技术的预测客户违约可能性。从风险管理的角度来看,预测的违约概率的准确性可以用来对可信的或不可信的客户进行分类。 本文首先对数据集进行了初步处理,将数据拆分为2000个训练集与1000个测试集。每个客户信息中有23个自变量,根据其各个因素的相关性进行了调整然后使用了5挖掘方法,包括KNN,分类树,随机森林,Logistic回归,神经网络进行建模,比较这5种方法中违约概率的预测准确性。其中神经网络的预测效果最好,预测准确率达到了83.3%;其次,分类树(81.8%)和随机森林(80.1%),然后是Logistic回归(78.3%)。KNN的预测结果最不理想(75.8%)。 关键词: 信用卡违约预测、数据分类、Logistic回归、分类树、KNN、神经网络、随机森林。
2019-12-21 21:45:13 1.25MB R语言 分类 神经网络
1