291294878

2018-10-19   阅读量: 1469

数据分析师 统计学

怎么处理决策树中的过拟合问题?

扫码加入数据分析学习群

处理决策树中的过分拟合:

A):先剪枝(提前终止规则):当观察到的不纯性度量的增益(或估计的泛化误差的改进)低于某个确定的阈值时就停止扩展叶节点。

B):初始决策树按照最大规模生长,然后进行剪枝的步骤,按照自底向上的方式修剪完全增长的决策树。修剪有两种方法:

(1)用新的叶节点替换子树,该叶节点的类标号由子树下记录中的多数类确定;

(2)用子树中常见的分支替代子树。当模型不能再改进时终止剪枝步骤。与先剪枝相比,后剪枝技术倾向于产生更好的结果。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
2.4134 1 4 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子