2021-03-30
阅读量:
1354
决策树可以处理连续变量吗?
问:
决策树可以处理连续变量吗?
答:
在C4.5及以上算法中是可以的,在 C4.5 算法中,增加了对特征变量为连续值的处理方法。由于连续属性的可取值数目不再有限,因此,不能直接根据连续属性的可取值来对结点进行划分.此时,连续属性离散化技术可派上用场。最简单的策略是采用二分法。如果输入特征字段是连续型变量,则算法首先会对这一列数进行从小到大的排序,然后选取相邻的两个数的中间数作为切分数据集的备选点,若一个连续变量有 N 个值,则在 C4.5的处理过程中将产生 N-1个备选切分点,并且每个切分点都代表着一种二叉树的切分方案。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论