gbdt是怎么填充的缺失值？_CDA答疑社区

热线电话：13121318867

登录

读童话的狼

2020-04-04 阅读量: 1371

gbdt是怎么填充的缺失值？

在决策树学习的初始阶段，根节点各样本的初始权重都为１

若样本x在划分属性a上的取值未知，则将x划入所有子节点，同时调整该样本x的权重值为r_v*w_x，其中r_v为无缺失值样本在属性a上取值为a^v的样本所占的比例，计算错误率的时候，需要考虑到样本权重

训练完成，给测试集样本分类，有缺失值怎么办？

如果有单独的缺失分支，使用此分支。
把待分类的样本的属性a值分配一个最常出现的a的属性值，然后进行分支预测。
根据其他属性为该待分类样本填充一个属性a值，然后进行分支处理。
在决策树中属性a节点的分支上，遍历属性a节点的所有分支，探索可能所有的分类结果，然后把这些分类结果结合起来一起考虑，按照概率决定一个分类。
待分类样本在到达属性a节点时就终止分类，然后根据此时a节点所覆盖的叶子节点类别状况为其分配一个发生概率最高的类。

0.0000

0

2

关注作者

收藏

评论(0)

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子