主要介绍了使用python 计算百分位数实现数据分箱代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2023-08-11 09:23:07 57KB python 百分位数 数据分箱
1
定义了多种分箱,也便于做单变量分析。决策时分箱,自定义阈值分箱等等。
2023-04-06 09:57:24 7KB 互联网金融 评分卡
1
分箱法是指通过考察“邻居”(周围的值)来平滑存储数据的值,用“箱的深度”表示不同的箱里有相同个数的数据,用“箱的宽度”来表示每个箱值的取值区间。
2022-05-22 15:24:56 52.42MB 数据预处理 Binning 分箱
1
JAVA数据预处理中的等宽和等频分箱操作源代码
2022-01-20 17:17:08 4KB 数据挖掘 数据预处理 JAVA 等宽分箱
1
今天小编就为大家分享一篇python实现连续变量最优分箱详解--CART算法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2021-12-16 09:23:40 58KB python 连续变量 分箱 CART算法
1
关于变量分箱主要分为两大类:有监督型和无监督型 对应的分箱方法: A. 无监督:(1) 等宽 (2) 等频 (3) 聚类 B. 有监督:(1) 卡方分箱法(ChiMerge) (2) ID3、C4.5、CART等单变量决策树算法 (3) 信用评分建模的IV最大化分箱 等 本篇使用python,基于CART算法对连续变量进行最优分箱 由于CART是决策树分类算法,所以相当于是单变量决策树分类。 简单介绍下理论: CART是二叉树,每次仅进行二元分类,对于连续性变量,方法是依次计算相邻两元素值的中位数,将数据集一分为二,计算该点作为切割点时的基尼值较分割前的基尼值下降程度,每次切分时,选择基尼下降
2021-11-05 18:24:54 58KB cart算法 python python函数
1
主要介绍了python 基于卡方值分箱算法的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
1
行业分类-外包设计-用于生产线上产品包装箱的分箱器.zip
2021-09-16 18:03:19 384KB
今天小编就为大家分享一篇python自动分箱,计算woe,iv的实例代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2021-05-14 19:08:00 111KB python 自动分箱 woe iv
1
链接: https://pan.baidu.com/s/1BLo62Y3i3WLEWBTm2ndE-Q 提取码详见附件。 来自网络分享于网络,仅供交流请不要用于商用。 ########################################################################################################## # SCORECARDS.py 全自动分箱逻辑回归制作评分卡 # # AUTHOR. S.ivannov # # REMARK: 1、源数据首列target为样本违约情况,1是BAD,0是GOOD ; # # 2、计算WOE前使用Kmeans聚类算法进行样本自动分箱,WOE本质是度量自变量每箱的违约数量占比ln量化,# # WOE越大则违约概率越大; # # 3、针对样本依次进行IV值(度量单一自变量对违约情况的ln量化---每箱加权和)、 # # person、VIF方法的自变量筛选,选取最优自变量因子组合; # # 4、针对样本优化选定的自变量因子组合进行逻辑回归、取得模型截距、刻度、自变量系数等常量; # # 5、生成评分卡模型、对验证集进行算分、预测; # ##########################################################################################################
1