tingyun
tingyun
有mac训练出较好的模型了吗?大佬给分享下经验吧,目前只最小epoch的有人声,但不声音不好。
> 有mac训练出较好的模型了吗?大佬给分享下经验吧,目前只最小epoch的有人声,但不声音不好。 刚才在colab里使用原来的素材,用默认参数,训练了一下,可以正常推理,下载到本地也正常推理。除了语速稍快,其他还好。看来是本地训练某个环节有问题,能不能是我们下载的那个底模,不支持苹果芯片的原因?
> > > 有mac训练出较好的模型了吗?大佬给分享下经验吧,目前只最小epoch的有人声,但不声音不好。 > > > > > > 刚才在colab里使用原来的素材,用默认参数,训练了一下,可以正常推理,下载到本地也正常推理。除了语速稍快,其他还好。看来是本地训练某个环节有问题,能不能是我们下载的那个底模,不支持苹果芯片的原因? > > 我的Mac是苹果芯片,你的是Intel芯片吗 m2芯片,本地训练多次尝试都是失败,只有呼噜声。有人说可能是我们下载的底模不支持苹果芯片,所以才会这样。colab训练后的模型下载下来,本地可以推理。
> 跨语种合成语音这几个功能都很不错 vits-fast那个,我在colab里一直没训练好。你是在mac本地训练么?我一直没找到本地的训练方式,搭建了环境,没成功。
> > 在看了各位大佬的分享经验,终于在mbp上跑起来了,感谢大家的分享。 但是有个问题,就是推理出来的声音没有大家演示的那么好。第一次推理默认步数,发现声音呼呼的没有字音,然后又增加了训练步数到15和30。然后推理还是不行。最后试了试训练后模型中步数最小的两个推理,有字音了,但是不那么理想。不知道这个和训练素材的长短是否有关?我现在是切割后11条,时长是56秒的素材。另外,这个素材的长度,以及与训练步数的设置,是否有什么关联呢?辛苦大佬指点一二,谢谢啦。  > > 建议云端训练试试,我测下来一样情况 嗯,如果实在不行的话,就云端训练,本地推理了。
> > > 跨语种合成语音这几个功能都很不错 > > > > > > vits-fast那个,我在colab里一直没训练好。你是在mac本地训练么?我一直没找到本地的训练方式,搭建了环境,没成功。 > > windows 本地训练 谢谢。我win的电脑配置不行,一直本地没搞起来。本以为这个终于有人关注mac电脑了,但是我运行起来了,训练的结果不理想。
这个该怎么用啊?直接替换inference_webui.py么?
>  > > 文心一言的话 直接替换inference_webui.py 就可以, 选择音频自动 出现文字,的功能 由于 我把路径写死了,必须放在指定的文件夹下才能正常运行。 [webui .py.txt](https://github.com/RVC-Boss/GPT-SoVITS/files/14076315/webui.py.txt) [inference_webui.py.txt](https://github.com/RVC-Boss/GPT-SoVITS/files/14076329/inference_webui.py.txt) 谢谢,这个文心一言在这里是做什么用的?
> > >  > > > 文心一言的话 直接替换inference_webui.py 就可以, 选择音频自动 出现文字,的功能 由于 我把路径写死了,必须放在指定的文件夹下才能正常运行。 [webui .py.txt](https://github.com/RVC-Boss/GPT-SoVITS/files/14076315/webui.py.txt) [inference_webui.py.txt](https://github.com/RVC-Boss/GPT-SoVITS/files/14076329/inference_webui.py.txt) > > > > > > 谢谢,这个文心一言在这里是做什么用的? > > 没啥用 就是搞着玩的 ,只是文心的回答 好,谢谢。