热线电话:13121318867

登录
2020-10-23 阅读量: 1231
决策树C4.5算法是如何处理数值型变量?

问:

决策树C4.5算法是如何处理数值型变量?

答;

在 C4.5 算法中,如果输入特征字段是连续型变量,则算法首先会对这一列数进行从小到大的排序,然后选取相邻的两个数的中间数作为切分数据集的备选点,若一个连续变量有 N 个值,则在 C4.5的处理过程中将产生 N-1个备选切分点,并且每个切分点都代表着一种二叉树的切分方案,
例如有如下数据集,数据集中只有两个字段,第一行代表年龄,是特征变量,第二行代表性别,是目标字段,则对年龄这一连续变量的切分方案如图所示:

image.png


0.0000
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子