生成速度太慢了有没有办法可以解决
显卡是4070s 生成大概 22s的语音,cosyvoice2需要20s左右, GPTSovitsV4, 使用预训练模型,大概只需要5.5s左右,差距太明显了 不过效果是cosyvoice2好 这个有办法像 GPTSovitsV4 一样采用预训练模型的方式提高生成速度吗
我也觉得奇慢无比
它这个新的推理框架没做完造成的,开启TRT就必须开启流式。速度虽然上来了但流式对生成音频的音质有影响。我换了1月份老版本cosyvoice2的推理代码和1月份的模型,开启TRT,关闭流式,速度还还不错。2080ti 22GB 的rtf在 0.6-1.0之间。
@lovewater 能分享包吗? 我想做下对比?
我用的这个版本的代码:commit 08312f4c4615b465d66ff55036be1cbd642904e6
老版本的模型用的 from modelscope import snapshot_download snapshot_download('aiwantaozi/CosyVoice2-0.5B', local_dir='CosyVoice2-0.5B')
@lovewater 能分享包吗? 我想做下对比?
@lovewater 我的是3080 开启trt后 load_trt=True fp16=True(不开会报错) 感觉也就快了一点点, rtf 1.6..... 是哪里姿势不对么?
3080 10GB版本吗?那估计只有fp16了,我跑fp32时,开启trt需要14GB显存, @anton-liam
我用改装版本。 内容: 刚才哥们喊我去喝酒撸串儿。我都拒绝了。我觉得我进步了。 rtf 0.089, cost 0.595s, all cost time 0.595s
@genicsoft 哥们 这得来些细节呀....
我用改装版本。 内容: 刚才哥们喊我去喝酒撸串儿。我都拒绝了。我觉得我进步了。 rtf 0.089, cost 0.595s, all cost time 0.595s
可以分享一下吗
我用改装版本。 内容: 刚才哥们喊我去喝酒撸串儿。我都拒绝了。我觉得我进步了。 rtf 0.089, cost 0.595s, all cost time 0.595s
哥们可以分享一下吗
@genicsoft 你这是来纯炫耀吧
音频生成耗时: 16.962秒, RTF: 0.572 我这平均0.5 3070 你们怎么那么慢
音频生成耗时: 16.962秒, RTF: 0.572 我这平均0.5 3070 你们怎么那么慢 你好,请问可以分享一下你用的哪个版本代码?我这儿也是特别慢,双CPU的4090还跑不过单CPU的3090