kurilab

https://klb.hatenablog.com/entry/portal

Computer Vision R&D

Results 104 issues of


                                            kurilab

Single Image Portrait Relighting

## 論文概要ポートレート画像のリライティングを行う。他の手法と違い形状や反射成分を推定する明示的な逆レンダリングステップを持たない。これはそのような方法はその推定モデルによって表現可能な結果に必然的に制限されるため。シーンの表現に物理的制約を課さず性能を向上させる。 ![bib_20220226 00](https://user-images.githubusercontent.com/16313809/155846014-eb33442a-cd50-4d01-b35a-ff5b4c98570b.jpg) https://arxiv.org/abs/1905.00824 ## Code 未確認。

Conference: SIGGRAPH

Year: 2019

Application: Inverse Rendering

Neural Video Portrait Relighting in Real-time via Consistency Modeling

## 論文概要リアルタイムで映像のポートレートのリライティングを行う。マルチタスクと敵対的学習戦略を組み合わせた構造と照明分離をすることで動的照明に対しロバスト性を担保している。またライトステージを使い603288枚のOLAT画像からなるデータセットを取得し公開。 ![bib_20220225 00](https://user-images.githubusercontent.com/16313809/155835547-b080faf6-c1f0-4866-8199-ea826b7618d4.jpg) https://zhanglongwen.com/projects/nvpr/ ## Code https://github.com/ZoneLikeWonderland/Neural-Video-Portrait-Relighting-in-Real-time-via-Consistency-Modeling ## Dataset https://zhanglongwen.com/projects/nvpr/dataset.html

Subject: Dataset

Conference: ICCV/ECCV

Year: 2021

Application: Inverse Rendering

Learning to Relight Portraits for Background Replacement

## 論文概要顔だけでない上半身ポートレート画像のリライティングを行う。LightMapと呼ばれる新しい画素単位の照明表現を導入しSOTA。アルベド推定において肌のアルベド色は強いPriorを持つためほぼ失敗しないが、衣服のアルベド推定は不正確になることがあるのがLimitation。 ![bib_20220224 00](https://user-images.githubusercontent.com/16313809/155436658-6569b729-1528-4c0f-831b-597d91a77a11.jpg) https://augmentedperception.github.io/total_relighting/ ## Code 未確認。

Conference: SIGGRAPH

Year: 2021

Application: Inverse Rendering

Single Image Portrait Relighting via Explicit Multiple Reflectance Channel Modeling

## 論文概要１枚の顔画像のリライティングを行う。複数のチャンネルを個別に明示的にモデル化することにより特に鏡面反射と影を含む難しい照明に対してロバストになる。また高品質な3D顔とレンダリングチャネルからなる大規模なポートレートデータセットを提示。またターゲットとなる照明を忠実にリライティング対象のポートレートに組み込むためのモジュール(Lighting-guided Feature Modulation)を提案。 ![bib_20220223 00](https://user-images.githubusercontent.com/16313809/155256088-291e0b7e-cc4e-4c85-83a8-34362f306a10.jpg) https://dl.acm.org/doi/abs/10.1145/3414685.3417824 ## Code 未確認 ## Dataset https://sireer.github.io/projects/FLM_project/

Year: 2020

Application: Inverse Rendering

Journal: TOG

EMLight: Lighting Estimation via Spherical Distribution Approximation

## 論文概要 1枚の画像から照明マップを推定する。既存研究で行われているように直接回帰をするのではなく、照明マップを球面光分布、光強度、環境光に分解しそれぞれへのパラメータ回帰タスクとして定義。また球面光分布間の距離をより正確に導出するための新しい球面移動損失を提案。 ![bib_20220222 00](https://user-images.githubusercontent.com/16313809/155255920-6aa4104d-14f9-4611-8279-630f8de2c578.jpg) https://arxiv.org/abs/2012.11116 ## Code 未確認。

Conference: AAAI

Year: 2021

Application: Inverse Rendering

Learning Physics-Guided Face Relighting Under Directional Light

## 論文概要顔のリライティングを行う。単なるEnd2Endの画像変換ではなく、まずアルベドと法線に分解を行い、入力した照明からShadingを計算し、拡散反射成分を得た後に、差分としての鏡面反射を残差成分として表現して、残差学習させるのがポイント。 ![bib_20200722 00](https://user-images.githubusercontent.com/16313809/88242253-82f11680-cc41-11ea-97aa-28545e0f3e0b.jpg) https://openaccess.thecvf.com/content_CVPR_2020/html/Nestmeyer_Learning_Physics-Guided_Face_Relighting_Under_Directional_Light_CVPR_2020_paper.html ## 感想シンプルなアイデアで余計な処理をしていない。

Subject: Dataset

Conference: CVPR

Year: 2020

Application: Inverse Rendering

Fake It Till You Make It: Face Analysis in the Wild Using Synthetic Data Alone

## 論文概要十分に優れた合成データの生成シミュレータがあれば、実データを１枚も使わずに「合成データのみの学習」でSOTAと同程度の結果が得られると主張。特に難しい顔のレンダリングにおいて学習データを大量に合成・学習し、顔解析・ランドマーク推定において実証。ドメインギャップを抑えた合成シミュレータを開発するには多くの専門知識と投資が必要だが、一度実装してしまえばそれ以降は最小限の努力で様々な学習データを生成可能。再ラベリングも容易。またHWのプロトタイプが存在しないカメラもシミュレートしてアルゴリズムを開発でき、更にHW設計にFBも可能。 ![bib_20220212 00](https://user-images.githubusercontent.com/16313809/153713277-9395fa2b-9f43-444b-9b08-982b456beec1.jpg) https://openaccess.thecvf.com/content/ICCV2021/html/Wood_Fake_It_Till_You_Make_It_Face_Analysis_in_the_ICCV_2021_paper.html ## Dataset https://github.com/microsoft/FaceSynthetics

Subject: Dataset

Field: ComputerGraphics

Conference: ICCV/ECCV

Year: 2021

Semi-Supervised Multi-Task Learning for Semantics and Depth

## 論文概要マルチタスク学習(MTL)は一般的に全てのタスクのGTが得られる事が前提だが、１つのデータセットに全てのGTがないのが普通である。そこでそのような不完全なデータセットに対してもMTLを適用するための戦略を提示。具体的にはラベルがないタスクに対しては敵対的学習を用いる。 ![bib_20220202 00](https://user-images.githubusercontent.com/16313809/152146937-d57e25b8-3146-48aa-8ba7-f760b035026c.jpg) https://openaccess.thecvf.com/content/WACV2022/html/Wang_Semi-Supervised_Multi-Task_Learning_for_Semantics_and_Depth_WACV_2022_paper.html ## Code 未確認。

Conference: WACV

Application: SIDE

Year: 2022

Application: Segmentation

Subject: MTL

Context Prior for Scene Segmentation

## 論文概要セマセグタスクの新しいアプローチ。まず入力画像(WxH)の対象画素と同じクラスの画素と違うクラスの画素のバイナリマップ(WxHxWxH)を推定し、真値でロス取って監視させながらセマセグマップを学習する。Context Priorと呼ぶ。従来では難しかったクラス内とクラス間のコンテキスト依存性を選択的に捉えることができるようになるので、ロバストな特徴表現を実現できる。当然性能はSOTA。CVPR2020採択。 ![bib_20200406 00](https://user-images.githubusercontent.com/16313809/78614933-e1c28980-7824-11ea-83ea-4bfa087cf04b.jpg) https://arxiv.org/abs/2004.01547 ## 感想色々な応用ができそうで超面白い。

Conference: CVPR

Year: 2020

Application: Segmentation

Deep Polarization Cues for Transparent Object Segmentation

## 論文概要透明物体のセグメンテーションは難しく、特に写真に印刷された透明物体と実際の透明物体を区別することは難しい。そこで偏光センサを用いて得られたマルチモーダル偏光情報をNNで学習させることで高精度な透明物体セグメンテーションを実現。シーン条件にロバスト。CVPR2020。 ![bib_20200728 00](https://user-images.githubusercontent.com/16313809/88752504-f5189e00-d10e-11ea-8d6e-e15f79f2d1da.jpg) https://openaccess.thecvf.com/content_CVPR_2020/html/Kalra_Deep_Polarization_Cues_for_Transparent_Object_Segmentation_CVPR_2020_paper.html ## 感想まず偏光が透明物体認識の課題に有効であるとローレベルで示してから、NNとの組み合わせを提案する流れ。

Conference: CVPR

Year: 2020

Input: Polarization

Application: Segmentation

‹
1
2
3
4
5
6
7
8
9
10
11
›