2018-11-06
阅读量:
1116
误差与拟合是什么?
在了解误差前先来了解下什么是错误率。通常我们把分类错误的样本数占总样本数的比例称为“错误率”,把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”。其中学习器在训练集数据上的误差称为“训练误差”,在新样本上的误差称为“泛化误差”,而使误差变小就是在降低分类错误率。
我们希望训练出来的学习器能在新样本表现得很好,泛化误差小,即学习器对新样本的拟合效果好。而新样本是什么事先是不知道的,所以能做的只有努力使训练误差最小化。然而当学习器把训练样本“学的非常好”时学习器有可能把训练样本自身的一些特性当做了所有样本都具有的一般特性,使得作用于新样本上的效果不理想,泛化性能差,这种现象称为“过拟合”;相对的,如果训练的学习器本身在训练数据上的拟合效果就不理想,训练误差大,此现象称为“欠拟合”。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论