MeloTTS icon indicating copy to clipboard operation
MeloTTS copied to clipboard

请问中文预训练模型在哪里可以下载?

Open liuxiong21 opened this issue 1 year ago • 25 comments

现在训练中文发现预训练模型是英文的

liuxiong21 avatar Apr 23 '24 11:04 liuxiong21

请问一下,知道预训练模型自动下载后保存在什么地方吗?我想删掉但找不到它的位置

Coder0015 avatar Apr 24 '24 01:04 Coder0015

请问一下,知道预训练模型自动下载后保存在什么地方吗?我想删掉但找不到它的位置

melo/logs/$dataset_name/ 下面

liuxiong21 avatar Apr 24 '24 02:04 liuxiong21

我观察到他是用cached-path包进行下载缓存的,模型缓存路径在~/.cache/cached_path/,这个项目是基于Bert-VITS2来做的,那么我猜想Bert-VITS2的中文模型或许能够直接用来替换掉官方的模型。

Coder0015 avatar Apr 24 '24 07:04 Coder0015

我观察到他是用cached-path包进行下载缓存的,模型缓存路径在~/.cache/cached_path/,这个项目是基于Bert-VITS2来做的,那么我猜想Bert-VITS2的中文模型或许能够直接用来替换掉官方的模型。

我训练过了,不行,可以说中文了,但是非常差

liuxiong21 avatar Apr 25 '24 01:04 liuxiong21

我观察到他是用cached-path包进行下载缓存的,模型缓存路径在~/.cache/cached_path/,这个项目是基于Bert-VITS2来做的,那么我猜想Bert-VITS2的中文模型或许能够直接用来替换掉官方的模型。

我训练过了,不行,可以说中文了,但是非常差

改下音标试试,我昨天用中日英混合的模型跑了一下,出的效果还是凑合的

Coder0015 avatar Apr 25 '24 02:04 Coder0015

我观察到他是用cached-path包进行下载缓存的,模型缓存路径在~/.cache/cached_path/,这个项目是基于Bert-VITS2来做的,那么我猜想Bert-VITS2的中文模型或许能够直接用来替换掉官方的模型。

我训练过了,不行,可以说中文了,但是非常差

改下音标试试,我昨天用中日英混合的模型跑了一下,出的效果还是凑合的

请问使用Bert-vits2 2.1版本的底模来训melo-tts吗?

v3ucn avatar Apr 25 '24 05:04 v3ucn

我观察到他是用cached-path包进行下载缓存的,模型缓存路径在~/.cache/cached_path/,这个项目是基于Bert-VITS2来做的,那么我猜想Bert-VITS2的中文模型或许能够直接用来替换掉官方的模型。

我训练过了,不行,可以说中文了,但是非常差

改下音标试试,我昨天用中日英混合的模型跑了一下,出的效果还是凑合的

请问使用Bert-vits2 2.1版本的底模来训melo-tts吗?

用的这个底模https://openi.pcl.ac.cn/Stardust_minus/Bert-VITS2/modelmanage/model_filelist_tmpl?name=Bert-VITS2%E4%B8%AD%E6%97%A5%E8%8B%B1%E5%BA%95%E6%A8%A1-fix

Coder0015 avatar Apr 25 '24 05:04 Coder0015

我观察到他是用cached-path包进行下载缓存的,模型缓存路径在~/.cache/cached_path/,这个项目是基于Bert-VITS2来做的,那么我猜想Bert-VITS2的中文模型或许能够直接用来替换掉官方的模型。

我训练过了,不行,可以说中文了,但是非常差

改下音标试试,我昨天用中日英混合的模型跑了一下,出的效果还是凑合的

请问使用Bert-vits2 2.1版本的底模来训melo-tts吗?

用的这个底模https://openi.pcl.ac.cn/Stardust_minus/Bert-VITS2/modelmanage/model_filelist_tmpl?name=Bert-VITS2%E4%B8%AD%E6%97%A5%E8%8B%B1%E5%BA%95%E6%A8%A1-fix

感谢

v3ucn avatar Apr 25 '24 06:04 v3ucn

请问这个底模怎么用?我把他放到logs项目,好像训练的时候会自动重写覆盖,出来的语音完全听不懂

ajiansoft avatar Jul 01 '24 10:07 ajiansoft

请问这个底模怎么用?我把他放到logs项目,好像训练的时候会自动重写覆盖,出来的语音完全听不懂

感谢 我试了下效果还可以 改download_utils.py 文件的 load_pretrain_model返回值

dhc45010 avatar Aug 07 '24 02:08 dhc45010

我观察到他是用cached-path包进行下载缓存的,模型缓存路径在~/.cache/cached_path/,这个项目是基于Bert-VITS2来做的,那么我猜想Bert-VITS2的中文模型或许能够直接用来替换掉官方的模型。

我训练过了,不行,可以说中文了,但是非常差

改下音标试试,我昨天用中日英混合的模型跑了一下,出的效果还是凑合的

请问使用Bert-vits2 2.1版本的底模来训melo-tts吗?

用的这个底模https://openi.pcl.ac.cn/Stardust_minus/Bert-VITS2/modelmanage/model_filelist_tmpl?name=Bert-VITS2%E4%B8%AD%E6%97%A5%E8%8B%B1%E5%BA%95%E6%A8%A1-fix

感谢

大佬,这是基于这个预训练模型再做训练吗?可以分享下训练好的模型吗?

lin-jj-engine avatar Aug 23 '24 09:08 lin-jj-engine

请问这个底模怎么用?我把他放到logs项目,好像训练的时候会自动重写覆盖,出来的语音完全听不懂

感谢 我试了下效果还可以 改download_utils.py 文件的 load_pretrain_model返回值

大佬,这是基于这个预训练模型再做训练吗?可以分享下训练好的模型吗?

lin-jj-engine avatar Aug 23 '24 09:08 lin-jj-engine

请问这个底模怎么用?我把他放到logs项目,好像训练的时候会自动重写覆盖,出来的语音完全听不懂

感谢 我试了下效果还可以 改download_utils.py 文件的 load_pretrain_model返回值

大佬,这是基于这个预训练模型再做训练吗?可以分享下训练好的模型吗?

对,根据这个底模https://openi.pcl.ac.cn/Stardust_minus/Bert-VITS2/modelmanage/model_filelist_tmpl?name=Bert-VITS2%E4%B8%AD%E6%97%A5%E8%8B%B1%E5%BA%95%E6%A8%A1-fix进行训练哈,我记得好像500轮就能出效果了 加油你可以的

dhc45010 avatar Aug 23 '24 09:08 dhc45010