2018-11-22
阅读量:
820
决策树中的修剪策略
修剪策略
决策树中主要有3种修剪策略:
- 最小错误。树被修剪回到交叉验证错误最小的点。交叉验证是使用大部分数据构建树,然后使用剩余部分数据来测试决策树的准确性的过程。
- 最小的树。树比最小错误稍微修剪一下。从技术上讲,修剪会创建一个决策树,其交叉验证错误在最小错误的1个标准误差范围内。较小的树更容易理解,但代价是误差小幅增加。
- 没有。
提前停止或预修剪
防止过度拟合的另一种方法是在产生非常小样本的叶子之前尽早尝试停止树木构建过程。这种启发式被称为早期停止, 但有时也被称为预修剪决策树。
在拆分树的每个阶段,我们检查交叉验证错误。如果错误没有明显减少,那么我们就停止了。通过过早停止可能会导致早期停止。当前的分裂可能没什么好处,但是已经做到了,随后的分割更加显着地减少了误差。
早期停止和修剪可以一起使用,也可以单独使用,或者根本不使用。修剪后的决策树在数学上更加严谨,找到一棵至少和早期停止一样好的树。早期停止是快速修复启发式。
如果与修剪一起使用,提前停止可以节省时间。毕竟,为什么要建造一棵树只能再次修剪它?






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论