2020-02-25
阅读量:
851
怎么对一个特征分箱?
怎么对一个特征分箱?
答:1)我们首先把连续型变量分成一组数量较多的分类型变量,⽐比如,将几万个样本分成100组,或50组;(尽量有监督的分箱)
2)确保每一组中都要包含两种类别的样本,否则IV值会⽆无法计算;
3)我们对相邻的组进行卡方检验,卡方检验的P值很大的组进⾏合并,直到数据中的组数小于设定的N
箱为⽌止;
4)我们让一个特征分别分成[2,3,4.....20]箱,观察每个分箱个数下的IV值如何变化,找出最适合的分箱
个数;
5)分箱完毕后,我们计算每个箱的WOE值, ,观察分箱效果






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论