DataScience:机器学习中特征工程之WOE编码(离散变量编码/有监督)的简介、计算过程、案例应用之详细攻略
(1)、什么是WOE编码
(2)、案例理解WOE编码
(3)、WOE编码技术的深度思考
(4)、为什么选择采用WOE编码?
(5)、WOE编码的优势
WOE编码—离散变量编码(有监督性的编码)
在建模前,我们需要把原始的值转化成WOE值才能使得模型效果好。
提出问题 怎样对字段的每个分段进行评分呢?这个评分是怎么来的?
解决方案 WOE编码,
将预测概率值转化为评分,
利用变量相关性分析和变量的系数符号保证每个分箱评分的合理性。
分箱之后我们便得到了一系列的离散变量,下面需要对变量进行编码,将离散变量转化为连续变量。WOE编码是评分卡模型常用的编码方式。