lovewater comments

Results 10 comments of


                                            lovewater

monterey and ventura not working after update to unraid 6.11.5(qemu7.1)

I have fixed this problem by doing this. But there is no hdmi audio, strange! https://github.com/thenickdude/KVM-Opencore/issues/56

关于 Cosyvoice2 在 H200 GPU 上启用 fp16 性能表现的疑问与探讨（Inquiry Regarding Cosyvoice2 fp16 Performance on H200 GPUs）

我在RTX5070ti上测得开启TRT后速度进步明显。最新版本TRT必须搭配流式输出使用，非常奇怪但也只有忍了。 FP16选项开和关，在5070ti上速度相差不大，但fp16更快。最后：消费级显卡从2080系开始就支持fp16了这不是什么新鲜玩意儿。

If you want to use trt with use_flow_cache=False, please set higher max_shape

同问！

If you want to use trt with use_flow_cache=False, please set higher max_shape

> use_flow_cache=False 不对啊，我的设置: load_jit=False, load_trt=True, fp16=False, use_flow_cache=False 删除plan文件文件件列表： asset CosyVoice-BlankEN flow.encoder.fp16.zip llm.pt campplus.onnx flow.cache.pt flow.encoder.fp32.zip README.md configuration.json flow.pt speech_tokenizer_v2.onnx cosyvoice2.yaml flow.decoder.estimator.fp32.onnx hift.pt 然后启动还是报这个错，我看这个是写到断言里的，和这个plan没啥关系啊。没有trt加速，这玩意慢得有点离谱啊

If you want to use trt with use_flow_cache=False, please set higher max_shape

> > > use_flow_cache=False > > > > > > 不对啊，我的设置: load_jit=False, load_trt=True, fp16=False, use_flow_cache=False 删除plan文件文件件列表： asset CosyVoice-BlankEN flow.encoder.fp16.zip llm.pt campplus.onnx flow.cache.pt flow.encoder.fp32.zip README.md configuration.json flow.pt speech_tokenizer_v2.onnx cosyvoice2.yaml flow.decoder.estimator.fp32.onnx hift.pt...

为什么新版本带 cache的flow流式合成，比之前不带cache的flow版本流式合成还慢了呢？

是的，就是在拉倒车，流式之后音质还有损失，没以前好了。我已经在生产环境退回1月份的代码了

流式推理效果疑问

我在生产环境上了新版，被客户吐槽惨了……现在退回cosyvoice2在1月份的代码和模型了

生成速度太慢了有没有办法可以解决

它这个新的推理框架没做完造成的，开启TRT就必须开启流式。速度虽然上来了但流式对生成音频的音质有影响。我换了1月份老版本cosyvoice2的推理代码和1月份的模型，开启TRT，关闭流式，速度还还不错。2080ti 22GB 的rtf在 0.6-1.0之间。

生成速度太慢了有没有办法可以解决

我用的这个版本的代码：commit 08312f4c4615b465d66ff55036be1cbd642904e6 老版本的模型用的 from modelscope import snapshot_download snapshot_download('aiwantaozi/CosyVoice2-0.5B', local_dir='CosyVoice2-0.5B') > [@lovewater](https://github.com/lovewater) 能分享包吗? 我想做下对比?

生成速度太慢了有没有办法可以解决

3080 10GB版本吗？那估计只有fp16了，我跑fp32时，开启trt需要14GB显存， @anton-liam