FireRedASR
FireRedASR copied to clipboard
推理优化
请问除了代码中的fp16以及flash attention,还有什么加速LLM-based ASR推理的方法吗?谢谢!
可以参考下:https://github.com/FireRedTeam/FireRedASR/pull/105