MeloTTS icon indicating copy to clipboard operation
MeloTTS copied to clipboard

基于bert-vits2有哪些改进点呢?

Open Polaris231 opened this issue 1 year ago • 7 comments

如题,melotts是基于bert-vits2改进而来的,想问下具体是哪些方面进行了改进和修改呢?

Polaris231 avatar Sep 26 '24 06:09 Polaris231

模型架構是一樣的,只是多新增了使用IPA訓練新語言。

jeremy110 avatar Sep 27 '24 02:09 jeremy110

模型架構是一樣的,只是多新增了使用IPA訓練新語言。

你好,我问一下这个怎么训练新语言的,比如我要训练客家话,我现在用10小时语料训练了4000多轮次,但是合成的效果很差,请问如果要训练新语言,要修改哪些代码吗?

lukeewin avatar May 13 '25 20:05 lukeewin

@lukeewin 或許你可以參考這個 https://github.com/myshell-ai/MeloTTS/issues/120 主要就是

  1. 新增 symbols
  2. 替換 bert
  3. 取代 g2p

jeremy110 avatar May 14 '25 01:05 jeremy110

@lukeewin 或許你可以參考這個 #120 主要就是

  1. 新增 symbols
  2. 替換 bert
  3. 取代 g2p

谢谢你的回复,我看了一下泰语的添加,但是不明白这个bert应该替换成什么样的?应该根据什么来替换?以及这个g2p是怎么取代的?

lukeewin avatar May 14 '25 18:05 lukeewin

  1. 基本上任何架構的 bert 都可以,但要是你的語言訓練出來的,或者拿你的語言去做 fine-tune。
  2. g2p 主要也是看你的語言如何將文字轉成拼音,也就是最後 phones 的格式。 在我這邊是轉成拼音,拼音再轉成 ipa,最後用 ipa 去做訓練。

jeremy110 avatar May 15 '25 01:05 jeremy110

  1. 基本上任何架構的 bert 都可以,但要是你的語言訓練出來的,或者拿你的語言去做 fine-tune。
  2. g2p 主要也是看你的語言如何將文字轉成拼音,也就是最後 phones 的格式。 在我這邊是轉成拼音,拼音再轉成 ipa,最後用 ipa 去做訓練。

我可以有偿让你帮我实现吗?我这里有要训练的语言的数据,你是否愿意有偿帮忙训练。

lukeewin avatar May 15 '25 09:05 lukeewin

抱歉 沒辦法 最近公司專案有點多,你那個需要花很多時間fine-tune bert,而且不一定會成功,另外 g2p 方面我不是專家,我是直接拿同事的程式來跑的。

jeremy110 avatar May 16 '25 01:05 jeremy110