热线电话:13121318867

登录
2020-07-16 阅读量: 919
决策树

# 1. 模型是对训练集里面的数据进行训练,以树的方式归纳出了X和Y之间的规律
# 2. 学习的过程中,如果不控制我们的树的话,树会不断的学习,生成的模型,会尝试将每一个训练样本都预测正确
# 3. 问题是训练集当中,很可能有噪音,如果噪音呢,决策树也会尝试将这部分信息给学习进去
# 4. 导致模型特别的复杂,枝叶特别的多,深度特别生
# 5. 该模型虽然在训练集下表现非常不错,但是也将噪音误以为是X和Y之间真实的规律学习进去了
# 6. 结果是该模型在测试集,未知的数据集下,表现就会很差,泛化能力差
# 7. 有的时候是有必要要控制模型的复杂的度,比如做最简单的方法就是设置max_depth。
# 8. 一个稍微简单一些模型,虽然可能在训练集上表现不是特别好,但是已经学习到了X和Y最真实规律,避免了噪音影响,导致模型的泛化能强

19.8851
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子