FastASR icon indicating copy to clipboard operation
FastASR copied to clipboard

[feature request] GPU runtime support

Open yuekaizhang opened this issue 1 year ago • 3 comments

这个项目太硬核了。大佬有兴趣支持一下gpu的runtime吗?或者在 fastertransformer里面支持一下 paraformer 或者 k2的模型?类型下面wenet这样的 https://github.com/NVIDIA/FasterTransformer/tree/main/examples/cpp/wenet https://github.com/NVIDIA/FasterTransformer/tree/main/src/fastertransformer/models/wenet

yuekaizhang avatar Mar 31 '23 08:03 yuekaizhang

您好,像这样手写推理会比onnx+tensorrt推理快么?感觉onnx+不同的Providers方式,更加合理些。

chenkui164 avatar Mar 31 '23 10:03 chenkui164

您好,像这样手写推理会比onnx+tensorrt推理快么?感觉onnx+不同的Providers方式,更加合理些。

cpu上的话,不确定这个手写推理有没有onnx快。gpu上的话,手写推理是最快的,也就是FasterTransformer这种形式,利用onnx去支持gpu的推理,远没有手写的快。 onnx + tensorrt的话,只要手写的没有大问题,一般也是手写的快。这也是为啥会有fastertransformer这种项目

yuekaizhang avatar Mar 31 '23 10:03 yuekaizhang

好的,感谢。paraformer模型在CPU上确实比不过ONNX,在优化就涉及到CPU底层的内容了,有点优化不动了。我先看看wenet的GPU实现,学习下。

chenkui164 avatar Mar 31 '23 10:03 chenkui164