Keisuke Ogaki

Results 26 issues of Keisuke Ogaki

**一枚の画像を背景と見た目のconditionとして加えた、poseからの人物画像生成** 論文本体・著者 ------------------ * Liqian Ma, Xu Jia, Qianru Sun, Bernt Schiele, Tinne Tuytelaars, Luc Van Gool * https://arxiv.org/abs/1705.09368 解きたい問題 ------------------ 新規性 ------------------ * 問題設定自体が新規だが、 #5 や #13 と類似の設定である。1ヶ月で3本とは。。。レッドオーシャンである。。。 *...

Computer Vision

**スケルトンを入力とした、連続性も考慮した動画GAN** 論文本体・著者 ------------------ * Yichao Yan*, Jingwei Xu*, Bingbing Ni, Xiaokang Yang * https://arxiv.org/abs/1707.01058 解きたい問題 ------------------ 新規性 ------------------ |![image](https://user-images.githubusercontent.com/17926501/28053102-b72ca1be-6649-11e7-9825-b96fce557935.png)| |---| |論文 Fig. 2 より| * 動画系列に対してロスを定義したこと * AdversarialとReconstructionはフレームbyフレームで、pix2pixとほぼ一緒 * 後述のtripletが系列を保証...

Computer Vision

**単一の学習済みモデルで音楽情報処理の複数の問題を解けるモデルを提案** 論文本体・著者 ------------------ * https://arxiv.org/abs/1703.09179 * Keunwoo Choi, György Fazekas, Mark Sandler, Kyunghyun Cho 解きたい問題 ------------------ * 音楽情報処理の基礎ネットワーク(VGG的なもの)を作りたい * 転移学習に使えるもの 新規性 ------------------ * こんなシンプルなネットワークでも既存のMFCC特徴より良いパフォーマンスを示す特徴が構成できる 実装 ------------------ * メルスペクトログラムをCNNかけた後に各層をaverage pooling(!) *...

Audio Processing

**あるフレーム画像と、そのフレームと異なるposeが与えられたときに、それに対応する画像を生成するimage analogy** 論文本体・著者 ------------------ * https://arxiv.org/abs/1706.08665v1 * Peter Wang, Zhongxia Yan, Jeff Zhang 解きたい問題 ------------------ 新規性 ------------------ |![image](https://user-images.githubusercontent.com/17926501/27812556-b354108a-60aa-11e7-87a9-129c91e833cd.png)| |---| |論文 Fig. 2 より| * poseから画像を生成するという問題設定 実装 ------------------ |![image](https://user-images.githubusercontent.com/17926501/27812569-ccae2f16-60aa-11e7-8359-3c71d68ec1e5.png)| |---| |論文...

Computer Vision

**画像補完タスクを用いて教師なし画像表現学習** 論文本体・著者 ------------------ * project: https://people.eecs.berkeley.edu/~pathak/context_encoder/ * code: https://github.com/pathak22/context-encoder * Deepak Pathak, Phillip Krähenbühl, Jeff Donahue, Trevor Darrell, Alexei A. Efros 解きたい問題 ------------------ * 教師無しで画像の表現学習をしたい * 転移学習に使えるもの 新規性 ------------------ |![image](https://user-images.githubusercontent.com/17926501/27542732-18864182-5ac3-11e7-872e-ec797c0d26e8.png...

Computer Vision

**音楽タグ付けにおいて、CNN+RNN(=CRNN)が有用であるという提案** 論文本体・著者 ------------------ * https://arxiv.org/abs/1609.04243 * Keunwoo Choi, George Fazekas, Mark Sandler, Kyunghyun Cho * ICASSP 2017 解きたい問題 ------------------ * CNNだけで音楽を認識するのは微妙なので、RNNの構造を入れて精度を上げたい 新規性 ------------------ 実装 ------------------ * 過去文献のCNNのみのモデルの最後にRNNを結合 * ![image](https://user-images.githubusercontent.com/17926501/27271886-5236d502-5502-11e7-9548-7ac9bbdaa83b.png) 実験・議論...

Audio Processing