papers
papers copied to clipboard
Summarizing the papers I have read (Japanese)
## 論文概要 ハイパースペクトル画像(HSI)の超解像はデータセットが少ないため難しい。そこでHSI SRとRGB画像のSRが相関していることを観察し、共同で学習する新しいマルチタスクネットワークを開発。補助タスクRGB画像SRが追加の監視を提供しネットワークの学習がしやすくなるとのこと。  https://openaccess.thecvf.com/content/WACV2022/html/Li_Hyperspectral_Image_Super-Resolution_With_RGB_Image_Super-Resolution_as_an_Auxiliary_WACV_2022_paper.html ## Code https://github.com/kli8996/HSISR
## 論文概要 Batch Normalizationのパラメータが活性化出力の特徴分布を推定するのに活用できるという観測結果。そこでBNパラメータからフィルタの重要度を測定しフィルタのpruningを行いネットワークを大幅に軽量化した。特にMobileNetV2では既存のPruning手法を凌駕することを示した。  https://openaccess.thecvf.com/content/WACV2022/html/Oh_Batch_Normalization_Tells_You_Which_Filter_Is_Important_WACV_2022_paper.html ## Code 未確認。
## 論文概要 FPGA等の組み込みプラットフォームと相性の良い軽量で高精度なディープなステレオマッチング。コストボリュームの次元(3D/4D)に応じて、2D/3Dの軽量ネットワークを設計。また2Dモデルの精度を向上させ3Dネットワークに近い性能を実現するために新しいコストボリュームを提案。  https://openaccess.thecvf.com/content/WACV2022/html/Shamsafar_MobileStereoNet_Towards_Lightweight_Deep_Networks_for_Stereo_Matching_WACV_2022_paper.html ## Code https://github.com/cogsys-tuebingen/mobilestereonet
## 論文概要 高精度かつ軽量な単眼Depth推定、NASを利用。多様性と探索空間の大きさのバランスをとるためにあらかじめ定義された基幹ネットワーク上で探索空間を構築する。軽量なベースラインモデルと比較しより少ないパラメータ(7%~500%コンパクト)で、性能を上回ることを確認。  https://openaccess.thecvf.com/content/WACV2022/html/Huynh_Lightweight_Monocular_Depth_With_a_Novel_Neural_Architecture_Search_Method_WACV_2022_paper.html ## Code 未確認。
## 論文概要 より正確な単眼Depth推定のためにシーンのRGBエッジとDepthエッジの類似性を利用しモデルを制約する。具体的にはエンコーダとデコーダの局所的な特徴のコサイン類似度を利用した適用的なアテンションモジュールを提案。汎用モデルにほぼパラメータ追加することなく実装可能。  https://openaccess.thecvf.com/content/WACV2022/html/Naderi_Monocular_Depth_Estimation_With_Adaptive_Geometric_Attention_WACV_2022_paper.html ## Code https://github.com/tnaderi/Monocular-Depth-Estimation-with-Adaptive-Geometric-Attention
## 論文概要 時間的に疎な入力を扱うSpiking Neural Networkの実施は電力効率が並外れているが、現状画像分類等の単純なタスクに限定されている。そこで物体検出が可能になるSpiking-Yoloを提案。Tiny Yoloの約280倍のエネルギー効率かつ従来のDNN→SNN変換手法と比較し2.3~4倍で収束。 現状主に単純なタスクにしか用いられていない理由として複雑なダイナミクスを扱えるスケーラブルな学習アルゴリズムを欠いていることが挙げられる。その回帰問題におけるSNNの性能低下について分析し従来の正規化手法の非効率性およびSNN領域でのLeaky ReLUの効率的な実装方法の欠如という課題を抽出。 そこでSNNに適した、チャネル毎の正規化およびReaky Reluについて提案。複数のニューロンの発火率をより高くかつ適切にすることが可能になる。最小のオーバーヘッドでニューロモーフィックチップ上に実装可能。  https://ojs.aaai.org//index.php/AAAI/article/view/6787 ## Code 未確認。
## 論文概要 低照度のLightField画像の復元を高速(従来比9倍)・低メモリ(23%縮小)で行いつつ1dB高い復元性能を達成。UNetは様々なLFビュー間の依存性を捉える表現力に欠けることを指摘し、RNNにインスパイアされたFeedforward型のネットワークを用いている。  https://openaccess.thecvf.com/content/WACV2022/html/Lamba_Fast_and_Efficient_Restoration_of_Extremely_Dark_Light_Fields_WACV_2022_paper.html ## Code https://github.com/MohitLamba94/DarkLightFieldRestoration
## 論文概要 古典的な高速アップスケーラと深層学習超解像とのギャップを埋めるためにシンプルさを追求した1つの畳み込み層からなる超解像アーキテクチャを提案。高速性要求時(ex.エッジデバイス)での明確な優位性を提示。モデルが単純なので解釈と中間ステップの可視化が容易で実用的。  https://openaccess.thecvf.com/content/WACV2022/html/Michelini_edge-SR_Super-Resolution_for_the_Masses_WACV_2022_paper.html ## Code 未確認
## 論文概要 コミック画像の奥行推定を行う。自然画像と違い真値がないので、まずコミック→自然画像のI2I変換を行いその後に単眼深度推定器で敵対的に学習することで真値がある自然画像のデータセットを利用する。前景と背景を明確に分離するために推定にラプラシアンエッジを利用。  https://openaccess.thecvf.com/content/WACV2022/html/Bhattacharjee_Estimating_Image_Depth_in_the_Comics_Domain_WACV_2022_paper.html ## Code 未確認。
## 論文概要 視野方向・光方向依存の反射率を表す完全なReflectance Fieldを推定する。反射率の各成分をパラメトリックにモデル化する代わりに、入力光の方向と視点・顔形状をパラメータとする幾何学的変形不変空間内に顔の基底集合を生成する。あらゆる視点・光条件下で再レンダ可能。  https://openaccess.thecvf.com/content/CVPR2021/html/R_Monocular_Reconstruction_of_Neural_Face_Reflectance_Fields_CVPR_2021_paper.html ## Code 未確認。