fish-speech
fish-speech copied to clipboard
[Feature]想了解下推理速度与显存消耗
如题,文档中没有关于GPU下TTS推理性能的情况,想大致了解下 另外 中英混 的效果如何呢? 🙏🙏
4060推理大约15tokens/s,具体效果可以自行测试。 编译后大概是100tokens/s.
4060推理大约15tokens/s,具体效果可以自行测试。
感谢大佬
我这里4060 laptop推理大约30tokens/s,编译后大约130tokens/s
请问下,“编译后”是指加streaming=True这个编译参数吗,我这边加上之后,速度没怎么变,还是30tokens/s呢。
请问下,“编译后”是指加streaming=True这个编译参数吗,我这边加上之后,速度没怎么变,还是30tokens/s呢。
自己看文档