2020-07-16
阅读量:
919
决策树
# 1. 模型是对训练集里面的数据进行训练,以树的方式归纳出了X和Y之间的规律
# 2. 学习的过程中,如果不控制我们的树的话,树会不断的学习,生成的模型,会尝试将每一个训练样本都预测正确
# 3. 问题是训练集当中,很可能有噪音,如果噪音呢,决策树也会尝试将这部分信息给学习进去
# 4. 导致模型特别的复杂,枝叶特别的多,深度特别生
# 5. 该模型虽然在训练集下表现非常不错,但是也将噪音误以为是X和Y之间真实的规律学习进去了
# 6. 结果是该模型在测试集,未知的数据集下,表现就会很差,泛化能力差
# 7. 有的时候是有必要要控制模型的复杂的度,比如做最简单的方法就是设置max_depth。
# 8. 一个稍微简单一些模型,虽然可能在训练集上表现不是特别好,但是已经学习到了X和Y最真实规律,避免了噪音影响,导致模型的泛化能强






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论