上传者: 42118701
|
上传时间: 2022-03-03 19:14:14
|
文件大小: 176KB
|
文件类型: -
Credit_Risk_Analysis
项目概况
我们正在分析来自点对点贷款服务公司LendingClub的数据,并创建一个机器学习模型来预测申请人的信用风险。
目的
该模型的目的是帮助简化贷款的申请流程。 对于该项目,我们将采用不同的采样技术来解决不平衡的类别。 然后,我们将测试和比较平衡的随机森林分类器和易集成分类器,这两个模型可减少偏差,并确定是否可以使用这两个模型来一致地预测申请人的信用风险。
结果
天真的随机过采样逻辑回归
平衡准确度得分:0.641
精度:0.01
召回率:0.65
SMOTE过采样逻辑回归
平衡准确度得分:0.663
精度:0.01
召回率:0.63
聚类质心欠采样逻辑回归
平衡准确度得分:0.545
精度:0.01
召回率:0.69
SMOTEENN组合抽样逻辑回归
平衡准确度得分:0.648
精度:0.01
召回率:0.71
平衡