FastASR [feature request] GPU runtime support

[feature request] GPU runtime support

Open yuekaizhang opened this issue 1 year ago • 3 comments

这个项目太硬核了。大佬有兴趣支持一下gpu的runtime吗？或者在 fastertransformer里面支持一下 paraformer 或者 k2的模型？类型下面wenet这样的 https://github.com/NVIDIA/FasterTransformer/tree/main/examples/cpp/wenet https://github.com/NVIDIA/FasterTransformer/tree/main/src/fastertransformer/models/wenet

Mar 31 '23 08:03 yuekaizhang

您好，像这样手写推理会比onnx+tensorrt推理快么？感觉onnx+不同的Providers方式，更加合理些。

Mar 31 '23 10:03 chenkui164

您好，像这样手写推理会比onnx+tensorrt推理快么？感觉onnx+不同的Providers方式，更加合理些。

cpu上的话，不确定这个手写推理有没有onnx快。gpu上的话，手写推理是最快的，也就是FasterTransformer这种形式，利用onnx去支持gpu的推理，远没有手写的快。 onnx + tensorrt的话，只要手写的没有大问题，一般也是手写的快。这也是为啥会有fastertransformer这种项目

Mar 31 '23 10:03 yuekaizhang

好的，感谢。paraformer模型在CPU上确实比不过ONNX，在优化就涉及到CPU底层的内容了，有点优化不动了。我先看看wenet的GPU实现，学习下。

Mar 31 '23 10:03 chenkui164

FastASR FastASR copied to clipboard

[feature request] GPU runtime support

FastASR
FastASR copied to clipboard