haoyumeng

2020-07-29   阅读量: 610

python

过拟合和欠拟合

扫码加入数据分析学习群


过拟合:

模型对训练集中的数据模拟的太好了,原因一般在于训练数据量小,模型过于复杂,特征维度过多,参数过多,噪声过多,连训练集中的噪声都能完美预测,这样的模型放在测试集中表现就不好了,泛化能力差。

一般用正则化降低参数值,减少特征维度来解决过拟合的问题。

解决方法:

  1. 从数据源头获取更多的数据,数据增强

  2. 使用合适的模型,减少网络层数,神经元个数,限制网络的拟合能力

  3. dropout

  4. 正则化,在训练师限制权值变大

  5. 数据清洗,纠正或删除错误数据

欠拟合:

模型在训练集中表现差,原因在于模型简单,特征维度过少,故放在测试集中效果一定也不好。

一般用增加模型的复杂度、增加数据量等手段来解决欠拟合的问题。


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
28.2525 2 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子