田齐齐

2020-04-14   阅读量: 663

机器学习

评分卡案例:IV值

扫码加入数据分析学习群

在机器学习的二分类问题中,IV值主要用来对输入变量进行编码和预测能力评估。特征变量IV值的大小即表示该变量预测能力的强弱。

衡量的是某一个变量的信息量。

根据IV值来调整分箱结构并重新计算WOE和IV,直到IV达到最大值,此时的分箱效果最好。

分组一般原则:

1.组间差异大

2.组内差异小

3.每组占比不低于5%

4.必须有好、坏两种分类

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
19.9816 5 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子