梁程晴

2020-09-08   阅读量: 923

Python

在图像分类任务中,训练数据不足会带来什么问题?如何缓解数据量不足带来的问题?

扫码加入数据分析学习群

图像分类任务上,训练数据不足带来的问题主要表现在过拟合方面,即模型在训练样本上的效果可能不错,但在测试集上的泛化效果不佳。

处理方法大致也可以分两类,一是基于模型的方法,主要是采用降低过拟合风险的措施, 包括简化模型(如将非线性模型简化为线性模型)、添加约束项以缩小假设空间(如L1/L2正则项)、集成学习、Dropout超参数等;二是基于数据的方法,主要通过数据扩充(Data Augmentation,数据增强),即根据一些先验知识,在保持特定信息的前提下,对原始数据进行适当变换以达到扩充数据集的效果。具体到图像分类任务中,在保持图像类别不变的前提下,可以对训练集中的每幅图像进行以下变换。

(1)一定程度内的随机旋转、平移、缩放、裁剪、填充、左右翻转等,这些变换对应着同一个目标在不同角度的观察结果。

(2)对图像中的像素添加噪声扰动,比如椒盐噪声、高斯白噪声等。

(3)颜色变换

(4)改变图像的亮度、清晰度、对比度、锐度等


31.0245 2 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子