箱庭XTer comments

Results 18 comments of


                                            箱庭XTer

参考音应用场景一点思考，例如喜怒哀乐的参考音，在项目中该如何实施（让一个人录制喜怒哀乐的一些参考音，对普通人来说感觉也是比较苦难的）

方法1：左AI踩右AI上天，反正你有数据，再练一个RVC，用RVC转换标准参考音频成新的参考音频（想法来自@是林克不是塞尔达）方法2：右转Bert Vits

在用作有声书合成生产力工具时，遇到的系列问题

@matthewxialin @AnonymousmousCoder 初步实现SSML，有想一起写的朋友研究一下 https://github.com/X-T-E-R/GPT-SoVITS-Inference/blob/stable/Inference/src/ssml_dealer.py

在用作有声书合成生产力工具时，遇到的系列问题

> 现在就剩了两个问题啦：看起来已解决的部分很不错欸，能看一看实现吗，就是已解决的部分（用llm自动确定角色和情绪之类的）

Adapting a TTS API for the GSVI (GPT-SoVits Inference) Project

> I couldn't test it because installing GPT-SoVits Inference requires registration on some Chinese Git host unless I'm missing something. Sorry I am testing the English Version, you could go...

Adapting a TTS API for the GSVI (GPT-SoVits Inference) Project

https://huggingface.co/XTer123/GSVI_prezip/tree/main Or just using the prezip for Windows !

如果只是单纯从接口上实现流式的话，现在有不少pull requests了，比如https://github.com/RVC-Boss/GPT-SoVITS/pull/448 https://github.com/RVC-Boss/GPT-SoVITS/pull/692 来推销一下我的推理特化项目：一切语音合成基于一个统一的API服务，并且实现了前后端分离、模型管理、多角色/情绪切换、流式推理等特性。 https://www.yuque.com/xter/zibxlp https://github.com/X-T-E-R/TTS-for-GPT-soVITS

各位佬，这个有可能做成流式实时合成语音吗

> 能不能流式跟推理速度关系不大吧目前的推理速度我感觉卡点在 GPT 模块的实时率比较低 > > 另外，目前模型合成长句子的方式是切成短句合成不是吗？句子级别的流式，是可接受的不？见上段