70 智能金融Lengding Club——构建贷款违约预测模型.docx
2022-04-23 14:03:19 854KB
人工智能_项目实践_贷款违约预测_基于随机森林算法的贷款违约预测模型研究 如何在发放贷款前有效的评价和识别借款人潜在的违约风险,计算借款人的违约概率,是现代金融机构信用风险管理的基础和重要环节。本文主要研究借助非平衡数据分类的思想对银行等金融机构的历史贷款数据进行统计分析,并使用随机森林算法建立贷款违约预测模型。实验结果表型,随机森林算法在预测性能上超过了决策树和逻辑回归分类算法。此外通过使用随机森林算法对特征进行重要性排序,可以得到对最终是否违约影响较大的特征,从而能够更有效的进行金融领域的借贷风险判断。
预测信用评分 在这个数据科学项目中,我们将通过建立信用评分预测模型来预测借款人违约的机会。 使用的技巧 决策树分类器 随机森林分类器 逻辑回归 支持向量机 人工神经网络 在该项目使用的五种技术中,发现人工神经网络具有82%的最高精度。 数据集: Credit_Scoring.csv 多合一笔记本: Credit_Scoring.ipynb
2022-03-30 13:28:36 44.17MB JupyterNotebook
1
主要介绍如何使用python搭建:基于三个经典机器学习算法的个贷违约预测模型。三大模型:朴素贝叶斯、随机森林、逻辑回归。
2022-02-25 14:07:11 7.15MB python 机器学习 随机森林 逻辑回归
专题报告:警惕低油价引发美国企业债违约潮(2020)(10页).pdf
2022-02-23 13:02:05 676KB 研究报告
合同管理、违约处理标准流程.doc
2022-02-22 09:04:13 25KB 企业管理
债券违约发行人全梳理(2021年).pdf
2022-02-12 13:02:12 713KB 行业
Home Credit 违约风险 - Kaggle 竞赛 https://www.kaggle.com/c/home-credit-default-risk/code 背景 在Kaggle Home Credit 违约风险竞赛中,参与者试图从应用程序、人口统计和历史信用行为数据中预测客户未来的支付行为。由于我在金融方面的学术背景,我想尝试一下信用风险数据集,这似乎是一个有趣的挑战。 0.8 的 ROC AUC 足以跻身本次比赛的获胜者之列,所以这就是我的目标。我想在这个数据集上尝试一些新方法,例如使用自动编码器进行特征缩减。 当前状态 主数据集包含 120 个特征和一个二进制目标变量。使用补充数据集,我能够将独立特征数增加到 1400 多个。我进行手动特征选择以将维度降低到 290 个最重要的特征。我目前正在使用自动编码器来替代手动特征选择。 使用 LightGBM,我能够获得超过 0.78 的 ROC AUC。现在我将不得不进行超参数调整以改进这个结果。
2022-01-28 09:06:23 732KB Kaggle
利用python实现随机森林算法预测信用卡违约情况,使用的是海豚大数据大数据分析赛的数据
2022-01-18 16:13:38 3KB 违约预测 随机森林
贷款违约数据集Default_Fin.csv
2022-01-17 19:15:04 269KB 机器学习 数据分析
1