nlp-survey-text2image Paired-D GAN for Semantic Image Synthesis (ACCV2018)

Paired-D GAN for Semantic Image Synthesis (ACCV2018)

Open SeitaroShinagawa opened this issue 5 years ago • 0 comments

テキストに条件づけられた画像編集の研究。

#15 に対して、編集対称の前景と背景にそれぞれ適用するDiscriminatorを用意し、背景の情報を保持して前景のみを編集した画像を生成している。

前景と背景に適用するDiscriminatorを別々に用意している
前景部分には二値のフィルターをかけている(DropOutのような正則化(構造的な情報を落とす)がねらい？)
Generator (Encoder, Decoder)の入出力近傍の層にはUNetでみるようなSkip connectionを導入し、元画像の構造的な特徴が残るようにしている

おそらく本手法は、元画像のテクスチャ情報の編集のみに着目して、形状の編集は苦手としていると思われる。テキストに条件づけられた、前景情報の画風変換手法と解釈するのが良いのではないだろうか。

Jun 01 '19 06:06 SeitaroShinagawa