SapphireLab

Results 75 comments of SapphireLab
trafficstars

参考泄露的问题时有发生,原因也挺多的,先考虑换个参考吧. 一个比较明确的原因是文本超过音频内容, 那么根据切句,会在每句出现多次泄露。 比如随便找个音频把这两句文本贴上去(文本明显超出音频内容)然后按四句一切就变成了两段,每段开头都会出现 `刀尖子就是道理`:`刀尖子就是道理`。宋 罗大经《鹤林玉露》卷一:“言少不更事之人,无所涵养,而骤膺拔擢,`刀尖子就是道理`。以当重任,力绵才腐,凛凛危亡而曾不知畏也。

> cuda加速不支持多线程/进程,多线程后相互竞争资源反而会很慢 https://github.com/RVC-Boss/GPT-SoVITS/issues/779#issuecomment-1999137227

cuda 工具对 nvidia 显卡驱动版本有要求,检查一下是否匹配。

只有省略号的位置可以考虑加个句号控制一下停顿,还有其他问题吗

> 没有吞字的现象吗,在虚空静寂,读者灵魂中如有音乐那一句 用的底模,参考音频也是随便找的,并没有吞字,可以考虑换换参考音频?

现在的 FasterWhisper 默认用了 float16 的精度,请问一下是什么设备? 可以考虑修改为 float32 进行尝试

半精度 cuFFT 需要 GPU 架构至少是 SM_53 以上,应该是你的显卡算力不够,所以可以考虑换个设备或者线上方案。

临时处理方案:手动移动:#796 or 自动下载:#861 1. 已经加过镜像 `https://hf-mirror.com` 应当能正常下载才对,可以访问 `https://hf-mirror.com/Systran/faster-whisper-large-v3/tree/main` 试试。 2. 一开始是考虑到可能存在多个项目都使用whisper模型可以直接从cache读取,所以没有写成强制下载到整合包路径。 现在的话就看是增加一个迁移的可选项,直接从cache目录移动到整合包还是按照 861 直接下载到整合包内。

~~问一下切分方式? 或更详细的反馈? 中英模式的错没能测出来,如果省略号后没有标点,选择按标点符号切会报 UnboundLocalError 错误,其他选项倒是都没错。~~ @KamioRinn 佬复现出来了,你这末尾原来是六个点不是中文省略号,反馈已收到,需要修复。

When you select other language options such as "auto", "ja","en", what exception will be thrown? The segments should be concatenated to get the full text of a single audio in...