jvs_hiho
jvs_hiho copied to clipboard
JVS (Japanese versatile speech) コーパスの自作のラベル
jvs_hiho
JVS (Japanese versatile speech) コーパスの、@Hiroshiba作のラベルです。
aligned_labels_openjtalk
JVSコーパスのpalallel100(話者間で共通する読み上げ音声100発話)を、読み仮名を音声に合うように修正した上で、Juliusによる自動アライメントを行った音素系列ラベルです。
詳細
音声に関して
@Hiroshibaが見つけた音声の間違いをもとに、一部の音声ファイルを修正・削除しています。 実行コードはaudio.bashです。
テキストに関して
voiceactoress100_spaced_julius.txtがテキストです。
JVSコーパス内にある日本語テキストを元に、以下の修正を加えました。
- カタカナ表記にする
- 読み仮名を音声に合わせる
- 句読点の位置を音声に合わせ、スペースにする
これらの修正を加えたテキストがvoiceactoress100_spaced.txtです。
この修正に加えて、更に以下の修正を加えました。
- 珍しい読みの
ツュ
とヴュ
を、チュ
とビュ
に変える
この修正を加えたテキストがvoiceactoress100_spaced_julius.txtです。
Julius音素系列ラベルに関して
aligned_labels_juliusがJulius音素系列ラベルです。
テキストvoiceactoress100_spaced_julius.txtを音素系列にし、Juliusのmonophone音素モデルを用いて音素をアライメントしました。
この際、ショートポーズsp
の有無もJuliusで推定しました。
実行コードはphoneme.bashです。
OpenJTalk音素系列ラベルに関して
aligned_labels_openjtalkがOpenJTalk音素系列ラベルです。
Julius音素系列をOpenJTalk用に変更しました。 OpenJTalk label getterを用いてOpenJTalk用の音素を取得し、一部を修正しました。 変更後の音素がvoiceactoress100_phoneme_openjtalkです。
その後、音素をJulius用のものに変換し、Juliusのmonophone音素モデルを用いて音素をアライメントしました。
実行コードはphoneme.bashです。
ライセンス
使用ライブラリに関して
テキスト・音素系列ラベルに関して
CC BY-SA 4.0(声優統計コーパスの音素バランス文のライセンスを継承しています)
実行コード(Bashスクリプト)に関して
MIT LICENSE