papers
papers copied to clipboard
Summarizing the papers I have read (Japanese)
## 論文概要 テキストの内容に従いセグメンテーションを行う。CLIPを直接利用すると画像レベルと画素レベルの予測との間に矛盾があるため好ましくない結果が得られてしまう。そこでCLIPモデルの知識を伝達するCRISというフレームワークを提案。従来手法に圧倒的な性能差をつけてSOTA。  https://openaccess.thecvf.com/content/CVPR2022/html/Wang_CRIS_CLIP-Driven_Referring_Image_Segmentation_CVPR_2022_paper.html ## Code 未確認。
## 論文概要 ブラインドのデブラー。中間画像をスクリーニングすることでより良いカーネルを推定する。中間画像中の不要な構造の特定をするために線形劣化モデルが有用であることを示唆。特に大きなブラーに対して優位性を発揮。  https://openaccess.thecvf.com/content/CVPR2022/html/Zhang_Pixel_Screening_Based_Intermediate_Correction_for_Blind_Deblurring_CVPR_2022_paper.html ## Code 未確認。
## 論文概要 サーマル(遠赤外線)画像の歩行者検出器を欺くことができる「赤外敵対的衣服」の提案。遠赤外線パターンは印刷するのが困難なため新素材であるエアロジェルを用いて最適なコードパターンの衣服を設計。この衣服を着るとYOLOv3のAPを64.6%下げられ、ステルスすることができる。  https://openaccess.thecvf.com/content/CVPR2022/html/Zhu_Infrared_Invisible_Clothing_Hiding_From_Infrared_Detectors_at_Multiple_Angles_CVPR_2022_paper.html ## Code 未確認。
## 論文概要 ローリングシャッター歪みを補正する。従来手法は等速度・等加速度モーションの仮定から外れた場合にゴーストやアーティファクトを生む。そこで動き解釈モジュールを採用し運動場を推定し、2つのRSフレームを共通のGSフレームにワープさせ、次いでリファインメントをする。  https://arxiv.org/abs/2205.12912 ## Code https://github.com/GitCVfb/CVR
## 論文概要 RGB+遠赤外線(もしくは遠赤外線のみ)のセマセグの広範なサーベイ。データセットやDeepなセマセグ手法のレビュー等。(遠)赤外線は天候や照明条件に影響されず詳細な情報を捉えることができるため、セグメンテーションの高性能化に大きく寄与する。  https://arxiv.org/abs/2205.13278 ## Code 未確認
## 論文概要 Self-Attentionを用いたFeasibleな計算量のマッチングパイプラインTransforMatcher。Match-to-Match Attentionを導入しマッチ間のグローバルな相互作用を考慮し長距離の関連性を捉える。特に困難な外観の変動下において有効。SPair-71kとPF-PASCALでSOTA。  https://arxiv.org/abs/2205.11634 ## Code 未確認。
## 論文概要 単眼Depth推定(SIDE)の性能を上げるために、空間上で互いに近い画像パッチ間の関係性をEdgeConvを用いて学習し構造情報を抽出する。SIDEにEdgeConvを用いたのは初。NYUv2とKITTIデータセットでSOTA。  https://openaccess.thecvf.com/content/WACV2022/html/Lee_EdgeConv_With_Attention_Module_for_Monocular_Depth_Estimation_WACV_2022_paper.html ## Code 未確認。
## 論文概要 低照度環境での撮影において高速かつ柔軟かつロバストな画像強調を実現する新しい学習フレームワーク。自己キャリブモジュールの影響下で各ステージの出力に制約をかけることで多様なシーンに適応能力を付与。暗い環境化での顔検出や夜間の車載セマセグ等への応用が可能。  https://arxiv.org/abs/2204.10137 ## Code https://github.com/vis-opt-group/SCI
## 論文概要 スマホとIMUおよび高品質な外部Depthカメラで取得した、人間のポートレートのビデオシーケンス1000からなるデータセット。カメラポーズ推定用途。様々な場所・照明条件で取得され、一定間隔でスマホからフラッシュが照射される。Visual SLAM、SfM等の手法をベンチマーク。  https://arxiv.org/abs/2204.10211 ## Code 未確認。 ## Dataset https://mobileroboticsskoltech.github.io/SmartPortraits/
## 論文概要 人物が写った写真の新規ビュー合成を行う。人物と背景を別々に(人物はメッシュで、背景は3次元点群によって)モデル化する。また合成された背景に合わせて人物を再照明するための外観変換手法を提案。  https://openaccess.thecvf.com/content/WACV2022/html/Freer_Novel-View_Synthesis_of_Human_Tourist_Photos_WACV_2022_paper.html ## Code 未確認。