制作评分卡时用到的数据card.csv
2022-07-03 12:05:15 7.21MB 机器学习
1
评分卡数据集rankingcard.csv 逻辑回归 制作评分卡时用到的数据
2022-05-12 16:06:11 7.21MB 评分卡数据集 评分卡 rankingcard.csv
1
因为教程中涉及一些数据用于建模的,这些数据是整理好的,供大家下载 (150000, 11)行,列,数据内容是银行的制作评分卡数据,用评分本质上是模式识别中的一类分类问题,将企业或者个体消费者划分为能够按期还本付息(即“好”客户)和违约(即“坏”)两类。 具体做法是根据历史数据中的样本,从已知的数据中找出违约及不违约客户的特征,从而总结出分类的规则,建立数学模型,用于测量价款人的违约风险(或者违约概率),为消费信贷决策提供依据。
2021-08-25 15:43:44 2.13MB 自行整理的数据
1
用逻辑回归制作评分卡时用到的数据。
2021-05-23 19:57:51 2.61MB 用逻辑回归制作评分卡
1
链接: https://pan.baidu.com/s/1BLo62Y3i3WLEWBTm2ndE-Q 提取码详见附件。 来自网络分享于网络,仅供交流请不要用于商用。 ########################################################################################################## # SCORECARDS.py 全自动分箱逻辑回归制作评分卡 # # AUTHOR. S.ivannov # # REMARK: 1、源数据首列target为样本违约情况,1是BAD,0是GOOD ; # # 2、计算WOE前使用Kmeans聚类算法进行样本自动分箱,WOE本质是度量自变量每箱的违约数量占比ln量化,# # WOE越大则违约概率越大; # # 3、针对样本依次进行IV值(度量单一自变量对违约情况的ln量化---每箱加权和)、 # # person、VIF方法的自变量筛选,选取最优自变量因子组合; # # 4、针对样本优化选定的自变量因子组合进行逻辑回归、取得模型截距、刻度、自变量系数等常量; # # 5、生成评分卡模型、对验证集进行算分、预测; # ##########################################################################################################
1