互联网消费金融是互联网金融公司为满足个人消费者对商品和服务的消费需
求所提供的小额贷款并分期偿还的信贷活动。与传统消费金融相比,互联网消费
金融具有服务方便快捷、大幅度降低交易成本、覆盖群体更广的特点。随着经济
水平的不断发展,人们消费观念的升级,互联网消费金融也逐渐被更多消费者认
可。面对数以万计甚至是数以十万计的申请借款的用户时,则需要通过互联网和
计算机领域的技术来解决这个用户信用风险的预测问题。
本文针对互联网消费金融的小额贷款申请,探讨机器学习技术在这个领域中
的发展情况和实际应用情况,研究违约用户和履约用户这两批用户的各方面特征,
介绍了在信用风险评估领域比较流行的Logistic回归模型和GBDT(梯度迭代决策
树)模型,以及主流的模型性能评价指标。在具体的实验中,本论文使用机器学
习技术对网络信贷平台的用户进行建模分析,使用Information Value统计量筛选变
量特征,采取 woe (weightofevidence)编码的方式对变量特征进行重新编码,以
提升变量对两类用户的辨别能力,最后,使用Logistic回归模型和GBDT(梯度迭
代决策树)模型对申请贷