热线电话:13121318867

登录
2021-03-30 阅读量: 1354
决策树可以处理连续变量吗?

问:

决策树可以处理连续变量吗?

答:

在C4.5及以上算法中是可以的,在 C4.5 算法中,增加了对特征变量为连续值的处理方法。由于连续属性的可取值数目不再有限,因此,不能直接根据连续属性的可取值来对结点进行划分.此时,连续属性离散化技术可派上用场。最简单的策略是采用二分法。如果输入特征字段是连续型变量,则算法首先会对这一列数进行从小到大的排序,然后选取相邻的两个数的中间数作为切分数据集的备选点,若一个连续变量有 N 个值,则在 C4.5的处理过程中将产生 N-1个备选切分点,并且每个切分点都代表着一种二叉树的切分方案。

image.png


47.6492
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子