Keisuke Ogaki issues

Results 26 issues of


                                            Keisuke Ogaki

Pose Guided Person Image Generation

**一枚の画像を背景と見た目のconditionとして加えた、poseからの人物画像生成** 論文本体・著者 ------------------ * Liqian Ma, Xu Jia, Qianru Sun, Bernt Schiele, Tinne Tuytelaars, Luc Van Gool * https://arxiv.org/abs/1705.09368 解きたい問題 ------------------ 新規性 ------------------ * 問題設定自体が新規だが、 #5 や #13 と類似の設定である。1ヶ月で3本とは。。。レッドオーシャンである。。。 *...

Computer Vision

Skeleton-aided Articulated Motion Generation

**スケルトンを入力とした、連続性も考慮した動画GAN** 論文本体・著者 ------------------ * Yichao Yan*, Jingwei Xu*, Bingbing Ni, Xiaokang Yang * https://arxiv.org/abs/1707.01058 解きたい問題 ------------------ 新規性 ------------------ |![image](https://user-images.githubusercontent.com/17926501/28053102-b72ca1be-6649-11e7-9825-b96fce557935.png)| |---| |論文 Fig. 2 より| * 動画系列に対してロスを定義したこと * AdversarialとReconstructionはフレームbyフレームで、pix2pixとほぼ一緒 * 後述のtripletが系列を保証...

Computer Vision

Transfer learning for music classification and regression tasks

**単一の学習済みモデルで音楽情報処理の複数の問題を解けるモデルを提案** 論文本体・著者 ------------------ * https://arxiv.org/abs/1703.09179 * Keunwoo Choi, György Fazekas, Mark Sandler, Kyunghyun Cho 解きたい問題 ------------------ * 音楽情報処理の基礎ネットワーク(VGG的なもの)を作りたい * 転移学習に使えるもの新規性 ------------------ * こんなシンプルなネットワークでも既存のMFCC特徴より良いパフォーマンスを示す特徴が構成できる実装 ------------------ * メルスペクトログラムをCNNかけた後に各層をaverage pooling(!) *...

Audio Processing

Hierarchical Model for Long-term Video Prediction

**あるフレーム画像と、そのフレームと異なるposeが与えられたときに、それに対応する画像を生成するimage analogy** 論文本体・著者 ------------------ * https://arxiv.org/abs/1706.08665v1 * Peter Wang, Zhongxia Yan, Jeff Zhang 解きたい問題 ------------------ 新規性 ------------------ |![image](https://user-images.githubusercontent.com/17926501/27812556-b354108a-60aa-11e7-87a9-129c91e833cd.png)| |---| |論文 Fig. 2 より| * poseから画像を生成するという問題設定実装 ------------------ |![image](https://user-images.githubusercontent.com/17926501/27812569-ccae2f16-60aa-11e7-8359-3c71d68ec1e5.png)| |---| |論文...

Computer Vision

Context Encoders: Feature Learning by Inpainting

**画像補完タスクを用いて教師なし画像表現学習** 論文本体・著者 ------------------ * project: https://people.eecs.berkeley.edu/~pathak/context_encoder/ * code: https://github.com/pathak22/context-encoder * Deepak Pathak, Phillip Krähenbühl, Jeff Donahue, Trevor Darrell, Alexei A. Efros 解きたい問題 ------------------ * 教師無しで画像の表現学習をしたい * 転移学習に使えるもの新規性 ------------------ |![image](https://user-images.githubusercontent.com/17926501/27542732-18864182-5ac3-11e7-872e-ec797c0d26e8.png...

Computer Vision

Convolutional Recurrent Neural Networks for Music Classification

**音楽タグ付けにおいて、CNN+RNN(=CRNN)が有用であるという提案** 論文本体・著者 ------------------ * https://arxiv.org/abs/1609.04243 * Keunwoo Choi, George Fazekas, Mark Sandler, Kyunghyun Cho * ICASSP 2017 解きたい問題 ------------------ * CNNだけで音楽を認識するのは微妙なので、RNNの構造を入れて精度を上げたい新規性 ------------------ 実装 ------------------ * 過去文献のCNNのみのモデルの最後にRNNを結合 * ![image](https://user-images.githubusercontent.com/17926501/27271886-5236d502-5502-11e7-9548-7ac9bbdaa83b.png) 実験・議論...

Audio Processing