livlea blog

Live as if you were to die tomorrow. Learn as if you were to live forever. (Mohandas Karamchand Gandhi)

Deep LearningのData Augmentationまとめ

Data Augmentation手法をまとめてみました。画像系のタスク用の手法に限定しています。

Geometric Transformation

  • ミラー(水平、垂直)
  • 回転
  • シフト
  • スケーリング
  • シアー変換
  • クロップ

Photometric Transformation

  • Color jitter (輝度、コントラスト、色相、彩度、明度、ガンマ)
  • PCA
  • エッジ強調
  • ブラー (ガウシアン、メディアン、平均、バイラテラル)

ノイズ付加

  • ガウシアン
  • ソルト & ペッパー

画像のMasking

  • Cutout
     - 画像の一部をマスクする
     - マスクの画素値は画像の平均、マスクをかける場所はランダムに決める
     - https://arxiv.org/abs/1708.04552
  • Random Erasing
     - cutoutと似ている
     - 全体の何割をマスクするか、また、マスクのアスペクト比も決める
     - https://arxiv.org/abs/1708.04896

画像のMixing

Deep Learningベースの手法

特徴空間上

  • Dataset Augmentation in Feature Space
     - 特徴空間のサンプル間の外挿を使用してデータセットを補強する
     - https://arxiv.org/abs/1702.05538

Augmentaionのpolicyを学習

GAN

GANを使ったものが今後は増えていく感じはしますが、ここではまとめていません。
そのうち、GANによるData Augmentationに絞ってまとめてみようと思っています。

参考

  • おなじみのPapers with Code。Data Augmentationの論文がまとまっている。
    paperswithcode.com

  • Data Augmentaionのサーベイ論文。
    ここに挙げていない色々な手法も紹介されているので、是非一読を。
    link.springer.com

  • 近年の論文手法をいくつか紹介している。
    heartbeat.fritz.ai