Data Augmentation 策略 数据增强是提高模型性能和泛化能力的重要方法.

深度学习数据增强策略主要有:

  • 随机调整 - Random resize
  • 平移 - Shift
  • 水平/垂直翻转 - Horizontal/Vertical flip
  • Rotation/Reflection 旋转/仿射变换
  • Noise - 高斯噪声,模糊处理</p>
  • 颜色增强 - Color Augmentation,包括色彩饱和度、亮度和对比度等.</p>
  • PCA Jittering 首先,按照 RGB 三个颜色通道计算均值和方差,规范网络输入数据; 然后,计算整个训练数据集的协方差矩阵,进行特征分解,得到特征向量和特征值,以作 PCA Jittering.</p>
  • <p>随机图像插值 - Random Image Interpolation,主要是在图像裁剪和缩放时采用.</p>
  • <p>裁剪采样 - Crop Sampling,从原始图像中缩放裁剪,得到网络输入. 常用有两种方式:
    • Scale Jittering,如 VGG 和 ResNet;</p>
    • <p>尺度和长宽比增强变换 - Scale and aspect ratio augmentation,如 Google Inception 网络; 其缺点:随机选择 crop center 时,可能出现选择的区域不包含目标物体的区域. </p>
  • <p>监督数据增强 - Supervised Data Augmentation(SDA) (海康威视2016提出)</p>
  • <p>类别标签不均衡问题 - Imbalanced Class Problem. 数据集中各类别所包含的样本数可能很不均匀,有的类别包含样本数很多,有的类别包含样本数很少. 海康威视2016 受 Class-Aware Sampling方法启发提出 Label Shuffling/Label Smoothing 策略. ​</p>

<h2>Reference</h2>

<p>[1] - 深度学习大讲堂 - 海康威视研究院ImageNet2016竞赛经验分享

[2] - 使用深度学习(CNN)算法进行图像识别工作时,有哪些data augmentation 的奇技淫巧? - 知乎

[3] - 深度学习之图像的数据增强

Last modification:October 9th, 2018 at 09:31 am