热线电话:13121318867

登录
2020-03-20 阅读量: 548
C4.5分支时是利用的二分法吗?

当属性类型为离散型,无须对数据进行离散化处理;当属性类型为连续型,则需要对数据进行离散化处理。C4.5算法针对连续属性的离散化处理,核心思想:将属性A的N个属性值按照升序排列;通过二分法将属性A的所有属性值分成两部分(共有N-1种划分方法,二分的阈值为相邻两个属性值的中间值);计算每种划分方法对应的信息增益,选取信息增益最大的划分方法的阈值作为属性A二分的阈值。

0.0000
3
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子