箱庭XTer
箱庭XTer
方法1:左AI踩右AI上天,反正你有数据,再练一个RVC,用RVC转换标准参考音频成新的参考音频(想法来自@是林克不是塞尔达) 方法2:右转Bert Vits
@matthewxialin @AnonymousmousCoder 初步实现SSML,有想一起写的朋友研究一下 https://github.com/X-T-E-R/GPT-SoVITS-Inference/blob/stable/Inference/src/ssml_dealer.py
> 现在就剩了两个问题啦: 看起来已解决的部分很不错欸,能看一看实现吗,就是已解决的部分(用llm自动确定角色和情绪之类的)
> I couldn't test it because installing GPT-SoVits Inference requires registration on some Chinese Git host unless I'm missing something. Sorry I am testing the English Version, you could go...
https://huggingface.co/XTer123/GSVI_prezip/tree/main Or just using the prezip for Windows !
哦,回答的话中文就可以了(我以为要用英文的来着)
如果只是单纯从接口上实现流式的话,现在有不少pull requests了,比如https://github.com/RVC-Boss/GPT-SoVITS/pull/448 https://github.com/RVC-Boss/GPT-SoVITS/pull/692 来推销一下我的推理特化项目: 一切语音合成基于一个统一的API服务, 并且实现了 前后端分离、模型管理、多角色/情绪切换、流式推理等特性。 https://www.yuque.com/xter/zibxlp https://github.com/X-T-E-R/TTS-for-GPT-soVITS
> 能不能流式跟推理速度关系不大吧 目前的推理速度我感觉卡点在 GPT 模块的实时率比较低 > > 另外,目前模型合成长句子的方式是切成短句合成不是吗? 句子级别的流式,是可接受的不? 见上段