任务:使用机器学习相关知识完成购房贷款违约预测,给定特征字段,输出是否会发生逾期的预测。
1.2 实验要求
1.2 题目背景
随着世界经济的蓬勃发展和中国改革开放的逐渐深入,无论是企业的发展还是从人们消费观念的转变,贷款已经成为企业和个人解决经济问题的一种重要方式。随着银行各种贷款业务的推出和人们日益膨胀的需求,不良贷款也就是贷款违约的概率也随之激增。为了避免贷款违约,银行等金融机构在发放贷款时会对借款人的信用风险进行评估或打分,预测贷款违约的概率并根据结果做出是否发放贷款的判断。如何在发放贷款前有效的评价和识别借款人潜在的违约风险,是金融机构信用风险管理的基础和重要环节,用一套科学的模型和系统来判定贷款违约的风险性可以将风险最小化和利润最大化。
1.2 数据集
数据集在../dataset 目录下,train.csv 为训练集数据,包含 120000 条数据,每条数据除去 id 和结果共有 50 个特征。test.csv 为预测集数据,包含 30000 条数据等待预测。
1.2 任务描述
本任务研究如何借助非平衡数据分类的思想对银行等金融机构的购房贷款数据进行分析,并基于随机森
1