paper_readings icon indicating copy to clipboard operation
paper_readings copied to clipboard

High-Resolution Image Inpainting using Multi-Scale Neural Patch Synthesis

Open Hiroshiba opened this issue 7 years ago • 2 comments

最初に低解像度な画像で修復して拡大し、周囲の画像とVGG特徴量が近くなるように入力画像を最適化する。これを拡大と最適化を繰り返すことで高解像な画像修復をする。

論文本体・著者

  • Chao Yang, Xin Lu, Zhe Lin, Eli Shechtman, Oliver Wang, Hao Li
  • https://arxiv.org/abs/1611.09969
  • CVPR2017

解きたい問題

新規性

image
論文 Fig. 1 より
  • contextual structuresを維持しつつ、高解像度な合成ができた

実装

image
論文 Fig. 2 より
  • 最初に、低解像度で修復箇所を推定
    • 学習はadversarial lossとMSE loss
  • 修復した画像をアップサンプルし、損失関数に従って画像を最適化する
    • 損失関数は、全体的な制約と、局所的な制約がある
    • 全体的な制約は、アップサンプル前の画像とのMSE
    • 局所的な制約はNeural Patchに似ている
      • 学習済みのVGG19にして特徴量Φを得る
      • 修復箇所のΦ1と、修復箇所以外のΦ2を求める
      • Φ1とΦ2のMSEを制約とする
        • Φ2は、Φ1から距離的に近く、かつ値も近いものを選択する
  • アップサンプルと最適化を繰り返すことで、高解像度な修復画像を合成する

実験・議論

image
論文 Fig. 4 より
  • 高解像度な画像修復ができている
  • 他にも様々な画像に用いた結果が紹介されている

読んだ中での不明点などの感想

  • 特に目新しい手法は無かったように思える

関連論文

Hiroshiba avatar Jul 05 '17 03:07 Hiroshiba

content networkの学習方法が面白かったりするのでしょうか

kogaki avatar Jul 05 '17 04:07 kogaki

いえ、content networkはautoencoder+GANで、特に珍しい部分は無さそうでした。 論文を全体的に見て、徐々に高解像度にしていく発想が面白いと感じました。

Hiroshiba avatar Jul 05 '17 08:07 Hiroshiba