sunjiawei321

2020-07-16   阅读量: 754

数据分析师 决策树

决策树

扫码加入数据分析学习群

# 1. 模型是对训练集里面的数据进行训练,以树的方式归纳出了X和Y之间的规律
# 2. 学习的过程中,如果不控制我们的树的话,树会不断的学习,生成的模型,会尝试将每一个训练样本都预测正确
# 3. 问题是训练集当中,很可能有噪音,如果噪音呢,决策树也会尝试将这部分信息给学习进去
# 4. 导致模型特别的复杂,枝叶特别的多,深度特别生
# 5. 该模型虽然在训练集下表现非常不错,但是也将噪音误以为是X和Y之间真实的规律学习进去了
# 6. 结果是该模型在测试集,未知的数据集下,表现就会很差,泛化能力差
# 7. 有的时候是有必要要控制模型的复杂的度,比如做最简单的方法就是设置max_depth。
# 8. 一个稍微简单一些模型,虽然可能在训练集上表现不是特别好,但是已经学习到了X和Y最真实规律,避免了噪音影响,导致模型的泛化能强

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
19.8851 2 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子