啊啊啊啊啊吖

2018-12-16   阅读量: 680

Python数据分析 数据分析师 机器学习

决策树里的叶子裁剪

扫码加入数据分析学习群

1.剪枝的原因和目的

解决决策树对训练样本的过拟合问题

2.决策树常用剪枝方法

预剪枝(Pre-Pruning)和后剪枝(Post-Pruning)

3. 预剪枝: 预剪枝是根据一些原则及早的停止树增长,如树的深度达到用户所要的深度、节点中样本

个数少于用户指定个数、不纯度指标下降的最大幅度小于用户指定的幅度等。

4. 后剪枝: 通过在完全生长的树上剪去分枝实现的,通过删除节点的分支来剪去树节点,可以使用的

后剪枝方法有多种,比如: 代价复杂性剪枝、最小误差剪枝、悲观误差剪枝等等

修剪方式有: 1)用叶子节点来替换子树,叶节点的类别由子树下面的多类决定

2)用子树最常用的分支来替代子树。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子