Kazuhiro KOBAYASHI comments

Results 24 comments of


                                            Kazuhiro KOBAYASHI

このリポジトリの目的

このレポジトリで開発しはじめた頃から考えていたのは，pythonとVCに初めて触れたB4の学生くらいが研究の事始めとして使えるレポジトリになれば良いと思ってました．声質変換は，"特徴抽出->アライメント->学習->変換->合成"とざっくりみると5つの要素からなっていて，これらの一連全てが動くコードをターゲットとする人たちに提供し，その一部を改変してもらう（主に，学習と変換）事で，研究をスタートさせれば良いかなと思っています．あと他には，聴覚系とかの音声分野に関連する人たちにサクッと使って貰えれば良いと考えています． low-level，つまり，最大限機能を分離したインターフェースを提供する事は，上の4つをより細かく分離していく事に相当すると思うのですが，low-levelな機能をガリガリ自前で実装して追加していく能力はないので，ライブラリとして充実したものにはならない様な気がします．それよりも，sprocket内でフワっと呼ぶと使えるインターフェースがあれば良いかなと思います．音声波形->[特徴抽出機]->音響特徴量が出て来るインターフェースがあって，パラメータを変えると特徴量の種類が変わるものや， - 特徴量群（特徴量ベクトルのリスト）->[アライメント]->jnt - jnt -> [GMMTrain] -> GMMparams - x, GMMparams -> [GMMconvert] -> y - F0, y_mcep, y_bap -> [Synthesizer] -> y_wav くらいで動くのが良いと思います．我々は，[]の機能をsprocketで提供すれば良いと考えています．...

Kazuhiro KOBAYASHI

このリポジトリの目的

このリポジトリの目的

このリポジトリの目的

Feature

Upload conversion samples

no such option: -c

Sphinx documentation

Sphinx documentation

For new features

bndapなどmcep以外の特徴量のGMMモデル化