如何理解欠拟合?常用的处理方法有哪些?
2020-07-08
2504
一、欠拟合概念及理解
机器学习中欠拟合是一个常见的问题,简单来说就是模型在训练和预测时表现都欠佳的情况。一个欠拟合的机器学习模型不是一个良好的模型并且在训练数据上表现不好这是显而易见的。
图中左边的表示size与prize关系的数据,中间的是出现欠拟合的模型,可以看出模型不能够很好地拟合数据,但如果将一个二次项添加到此模型的后面,就可以很好地拟合图中的数据了,就会有右侧的效果。
欠拟合问题,根本的原因是特征维度过少,导致拟合的函数无法满足训练集,误差较大。
二、常用的解决欠拟合问题的方法:
1.模型复杂化
对同一个算法复杂化。例如回归模型添加更多的高次项,增加决策树的深度,增加神经网络的隐藏层数和隐藏单元数等
弃用原来的算法,使用一个更加复杂的算法或模型。例如用神经网络来替代线性回归,用随机森林来代替决策树等
2.增加更多的特征,使输入数据具有更强的表达能力
特征挖掘十分重要,质量高的强表达能力的特征,抵得过大量弱表达能力的特征。但是挖掘强特,还必须对数据本身以及具体应用场景的深刻理解,这需要依赖于过往经验。
3.调整参数和超参数
超参数包括:
神经网络中:学习率、学习衰减率、隐藏层数、隐藏层的单元数、Adam优化算法中的β1β1和β2β2参数、batch_size数值等
其他算法中:随机森林的树数量,k-means中的cluster数,正则化参数λλ等
4.降低正则化约束
正则化约束是为了防止模型出现过拟合,现在模型的情况是欠拟合了,就需要降低正则化参数λλ或者直接去除正则化项