809669515

2018-11-01   阅读量: 1593

数据分析师 机器学习 数据挖掘

什么是分箱?

扫码加入数据分析学习群

分箱或离散化是将数值变量转换为分类对应物的过程。例如,将Age的值分为20-39,40-59和60-79等类别。数值变量通常在基于频率表(例如,决策树)的建模方法中离散化。此外,分箱可以通过降低噪声或非线性来提高预测模型的准确度。最后,分箱可以轻松识别异常值,数值变量的无效值和缺失值。

有两种类型的分箱,无监督监督

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
6.8974 1 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子