1.剪枝的原因和目的
解决决策树对训练样本的过拟合问题
2.决策树常用剪枝方法
预剪枝(Pre-Pruning)和后剪枝(Post-Pruning)
3. 预剪枝: 预剪枝是根据一些原则及早的停止树增长,如树的深度达到用户所要的深度、节点中样本
个数少于用户指定个数、不纯度指标下降的最大幅度小于用户指定的幅度等。
4. 后剪枝: 通过在完全生长的树上剪去分枝实现的,通过删除节点的分支来剪去树节点,可以使用的
后剪枝方法有多种,比如: 代价复杂性剪枝、最小误差剪枝、悲观误差剪枝等等
修剪方式有: 1)用叶子节点来替换子树,叶节点的类别由子树下面的多类决定
2)用子树最常用的分支来替代子树。
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar