Ping.X

Results 5 comments of Ping.X

same problem, any progress?

> FireRedASR模型在语音识别的准确率方面已经冠军群雄了,但当前并不支持流式响应,而现在的模型 也不支持时间戳输出,导致在生产和日常场景难有很好的实际应用。 感谢开发团队,也希望请问下,未来是否有打算开发支持流式传输的版本,以及对于非流式传输模型的时间戳支持呢? 可以看下这个项目:https://github.com/xphh/fireredasr-streaming 我基于模型自回归的特性,修改了下推理代码,可以做到流式,响应延迟在T4下可以控制在200ms以内

可以看下这个项目:https://github.com/xphh/fireredasr-streaming 我基于模型自回归的特性,修改了下推理代码,可以做到流式,响应延迟在T4下可以控制在200ms以内

或者直接使用torch.compile