Zhou Hao
Zhou Hao
感觉还是GPT生成的不稳定,多几次就可以了。另外,和引导音频也有关系,我常常遇到的是[这里提到的zero prediction](https://github.com/RVC-Boss/GPT-SoVITS/issues/47) > 古人把它与海棠、牡丹、桂花并列,美称为“玉堂富贵”,不仅能给人以“点破银花玉雪香”的美感,还有“堆银积玉”的富贵;若种植于道路两侧作行道树,盛花时节漫步玉兰花道,可体会到“花中取道、香阵弥漫”的愉悦之感。 **引导音频**:`vo_EQHDJ_talk_19_zhongli_07.wav` (原神钟离) https://github.com/RVC-Boss/GPT-SoVITS/assets/302680/c63c007c-2995-4ef0-9eba-700e438b9472 句首少了个字
> @upbit 你的参考音频是多长的?建议在5~10s之间,不要超过10秒。另外更新下代码试试,优化了一些效果。 更新后好了很多,换了另一个引导词(7秒),基本没有遇到过吞字的情况。 https://github.com/RVC-Boss/GPT-SoVITS/assets/302680/5a87a954-94c8-4a93-8567-b4a12aead2a5 感谢这么棒的项目~
合入最新main的代码
> 请问您所使用的gradio版本是多少的?我看audio控件没有声明streaming=True,我用这个分支跑了一下,并没有流式输出的效果。 `gradio==4.17.0`,需要大于这个版本才支持这个特性。官方例子:[stream_audio_out/run.py](https://github.com/gradio-app/gradio/blob/gradio%404.17.0/demo/stream_audio_out/run.py) 启动这个WebUI包装:`python GPT_SoVITS/inference_stream.py` ps: 我用的是MacOS录屏没有声音,晚点用Windows验证下。可以用example里长一些的文本,实测Mac需要差不多两句后才开始自动播放
> > > 请问您所使用的gradio版本是多少的?我看audio控件没有声明streaming=True,我用这个分支跑了一下,并没有流式输出的效果。 > > > > > > `gradio==4.17.0`,需要大于这个版本才支持这个特性。官方例子:[stream_audio_out/run.py](https://github.com/gradio-app/gradio/blob/gradio%404.17.0/demo/stream_audio_out/run.py) > > 启动这个WebUI包装:`python GPT_SoVITS/inference_stream.py` > > ps: 我用的是MacOS录屏没有声音,晚点用Windows验证下。可以用example里长一些的文本,实测Mac需要差不多两句后才开始自动播放(视频未加速) > > output.mp4 > > 感谢,我用mac os试下,非常赞的一边推理一边播放的流式效果 手边没有windows的机器,晚点我验证完,等主干稳定后再push一版。也可以看看有没有其他要调整的CR点
你试试 stream as file 后,点击播放按钮试试。看他代码没有加自动播放
> > 你试试 stream as file 后,点击播放按钮试试。看他代码没有加自动播放 > > 可以了,应该是浏览器版本问题导致的,对浏览器版本要求比较特别,Windows还是不支持 是的。最开始调这个时,发现Chrome Windows版本对音频自动播放做了限制,得单独打开 https://developer.chrome.com/blog/autoplay
重新合并了下上游的变更: 1. 默认WebUI模式,演示流式音频推理(自动播放需要Mac的Chrome):`is_half=False python GPT_SoVITS/inference_stream.py` 2. 支持流式API模式(uvicorn):`is_half=False python GPT_SoVITS/inference_stream.py --api`
> 请问如何验证效果, 代码已经同步 * MacOS上运行:`is_half=False python GPT_SoVITS/inference_stream.py` * Windows上直接运行:`python GPT_SoVITS/inference_stream.py` 长文本案例下面example部分有,另外Windows下Chrome推理开始后,可能需要点播放才能开始听结果
> > > 请问如何验证效果, 代码已经同步 > > > > > > > > * MacOS上运行:`is_half=False python GPT_SoVITS/inference_stream.py` > > * Windows上直接运行:`python GPT_SoVITS/inference_stream.py` > > > > > > 长文本案例下面example部分有,另外Windows下Chrome推理开始后,可能需要点播放才能开始听结果 >...