Zhou Hao comments

Results 78 comments of


                                            Zhou Hao

推理部分，增加gradio的wav音频流式输出演示

Windows下目前只能用API模式，运行方法： ```bash python GPT_SoVITS/inference_stream.py --api # 访问 http://localhost:5000?text= ``` Windows下流式推理录屏（Chrome不会自动播放，需要等推理完2句后点下播放）： https://github.com/RVC-Boss/GPT-SoVITS/assets/302680/b9da9190-11c5-478a-8243-4660c39da48e 补充：Gradio的音频控件，Windows下设置 `autoplay=False` 就可以类似视频里的流式播放（不然Chrome下会报 `The AudioContext was not allowed to start. It must be resumed (or created) after a user...

推理部分，增加gradio的wav音频流式输出演示

> 这个应该是切分了句子之后，按句子级别进行输出的流式？对，默认用的是按标点符号切割。新的`推理加速`分支，加入了分片的yield，这里等flash attention等改动合入后，我再提一版（避免冲突）。如果测试可以先用这个分支的代码：https://github.com/upbit/GPT-SoVITS/tree/streaming > 如果不是MacOS推理，Windows目前会因为gradio的Audio请求一直挂起（直到推理结束），因此暂时只能在API模式下实现视频里流式播放效果。

推理部分，增加gradio的wav音频流式输出演示

> 大佬您好，参考大佬给出的方式实现了流式处理，但是我这边发现一个问题，流式输出后会在每一段的语音最后有个短暂的类似于的爆音的杂音，不知道大佬有没有遇到过，有一些排查的思路吗？感谢感谢没有遇到过类似情况，是最新分支吗？我晚点测试看看记得代码里每个batch，[推理音频后会附加一个zero_wav用于停顿](https://github.com/upbit/GPT-SoVITS/blob/streaming/GPT_SoVITS/TTS_infer_pack/TTS.py#L611)，你可以去掉试试： `audio_fragment = torch.cat([audio_fragment, zero_wav], dim=0)`

Zhou Hao

推理部分，增加gradio的wav音频流式输出演示

推理部分，增加gradio的wav音频流式输出演示

推理部分，增加gradio的wav音频流式输出演示

推理部分，增加gradio的wav音频流式输出演示

升级更新到UE5后运行崩溃？

如何解决offset不能超过5000的限制？

illust_comments() responds with 404

尝试为aapi.py中的部分方法添加TypedDict类型注解

尝试为aapi.py中的部分方法添加TypedDict类型注解

pixiv_auth.py Is Gone / How to Get Refresh Token