RVC-Boss

Results 538 comments of RVC-Boss

> > 你说得对,确实没对齐 刚才看了下跑seedtts评测脚本的代码,bert是一起推的 不太记得这个地方是啥时候被改成分开推bert的了 你有试过分开和不分开的效果有什么差别吗? > > 效果上的差别还没尝试,最近我会测试一下,看能否对一些已知问题有帮助 “跑seedtts评测脚本的代码,bert是一起推的”:这里指的是seed-tts-eval这个仓库吗? 用的他那里面的模型,代码结构自己写的

虽然我没试过但是我个人感觉,难度可能会比较大

> 能运行pytorch应该就行 不确定NPU对音频领域里各种奇怪算子的支持程度

@L-jasmine 感觉你俩的代码有冲突,有办法合一起吗,或者把torchscipt的部分拆出到别的py去?

> > @L-jasmine 感觉你俩的代码有冲突,有办法合一起吗,或者把torchscipt的部分拆出到别的py去? > > @RVC-Boss 哪个文件有冲突?我这里好像看不到冲突。我明天仔细对一下,要提取到别的py 也可以 @L-jasmine https://github.com/RVC-Boss/GPT-SoVITS/pull/2258/files#diff-0717e9c822f278db602fcc4037bc1340671ebcc407ce41398f5b69a49a0092fb models_onnx.py,我看有的函数接口变化了 就是你拿新代码跑跑看torchscipt还能正常跑吗

我该怎么复现你们的结果,能否提供训练参数和训练集

> 数据集和推理结果,康辉说话带些气泡音,换其他人会更电一些 [foo.zip](https://github.com/user-attachments/files/19057315/foo.zip) > > 参数设置,这里参数都是默认的,除了中间模型多存了俩 > > ![Image](https://github.com/user-attachments/assets/5d5e33d6-3cb1-480f-bb57-198c5364c232) ![Image](https://github.com/user-attachments/assets/24fcb97d-0687-4afd-8fed-86a3a32a9bbf) ![Image](https://github.com/user-attachments/assets/95969ff5-de44-491a-9f7b-930123b2674a) 我测试一下

> 数据集和推理结果,康辉说话带些气泡音,换其他人会更电一些 [foo.zip](https://github.com/user-attachments/files/19057315/foo.zip) > > 参数设置,这里参数都是默认的,除了中间模型多存了俩 > > ![Image](https://github.com/user-attachments/assets/5d5e33d6-3cb1-480f-bb57-198c5364c232) ![Image](https://github.com/user-attachments/assets/24fcb97d-0687-4afd-8fed-86a3a32a9bbf) ![Image](https://github.com/user-attachments/assets/95969ff5-de44-491a-9f7b-930123b2674a) 刚准备测试,看到你包里发的结果的v2和v3,我感觉v3的混响环境是跟训练集更贴切的,并且v2的呼吸还有电(10秒处),v3没有。v2的,7s秘书“zhang”v2发音不如v3,听不出v3哪里有问题(是指音色的洪亮程度吗)

fumiama 传递了大量错误的信息,我会澄清一些你们很可能认知错误的事情。为使得我的表述不被误解,我将亲自将其翻译成英文。 Fumiama has conveyed a lot of incorrect information. I will clarify some things that you are very likely to misunderstand. To ensure that my statements are not misinterpreted,...