热线电话:13121318867

登录
2018-11-16 阅读量: 1035
偏倚-方差权衡

思考过拟合问题的另一种角度是把它作为偏倚和方差之间的权衡。 偏倚和方差这两个名词

是用来度量在(来自同一个大型总体的)不同的训练数据集上多次重复训练模型的情况。

这表明该模型偏倚较高。然而任何两个随机选择的训练集会

给出很相似的模型(因为任何两个随机选择的训练集都应该有大致相似的平均值)。所以

我们称这个模型有低方差。高偏倚和低方差典型地对应着欠拟合。

另一方面,模型完美地拟合训练集,它具有很低的偏倚和很高的方差(因为任何两个

训练集都可能给出非常不同的模型形式)。 这种情况对应过拟合。

如果你的模型有高偏倚(这意味着即使在训练数据上也表现不好),可以尝试加入更多的

特征。从 0 阶模型到 1 阶模型就是一个很大的改进。

如果你的模型有高方差, 那可以类似地移除特征;另一种解决方法是(如果可能的话)获

得更多的数据。

在模型复杂度不变的前提下,你有越多的数据,就越难过拟合。

另一方面,更多的数据对偏倚并不会有帮助。如果模型不能使用足够多的特征来捕捉数据

的正则性,那么再多的数据也不会有帮助。

0.0000
4
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子