影响个人信用的因素很多。 将套索技术引入个人信用评估,分别建立套索逻辑,套索支持向量机和组套索逻辑模型。 变量选择和参数估计也同时进行。 根据某贷款平台的个人信用数据集,可以通过实验得出结论,与全变量Logistic模型和逐步Logistic模型相比,Group Lasso-Logistic模型的变量选择能力最强,其次是套索物流和套索SVM。 这三个基于套索变量选择的模型都具有比逐步选择更好的过滤能力。 同时,组套索逻辑模型可以消除或保留相关的虚拟变量作为一个组,以方便模型解释。 在预测准确性方面,Lasso-SVM在训练集中对默认用户的预测准确性最高,而在测试集中,Group Lasso-logistic对默认用户的分类准确性最高。 无论是在训练集中还是在测试集中,套索逻辑模型对于非默认用户都具有最佳分类精度。 基于套索变量选择的模型还可以更好地筛选出影响个人信用风险的关键因素。
1