FasterTransformer What's the difference between FasterTransformer and TensorRT

What's the difference between FasterTransformer and TensorRT

Open puyuanOT opened this issue 2 years ago • 3 comments

Is FasterTransformer developed based on TensorRT? Is FasterTransformer more efficient than TensorRT when perfoming inference with Transformer models (e.g., llama)?

And what's the difference between FasterTransformer and Huggingface/betterTransformers?

May 22 '23 21:05 puyuanOT

https://github.com/NVIDIA/FasterTransformer/issues/211#issuecomment-1093495810

May 27 '23 18:05 ankit-db

In my case, BetterTransformer from PyTorch is faster than FasterTransformer from NVIDIA (fp32, max len 512, Roberta large)

Aug 24 '23 10:08 duongkstn

Given latest development, how does this repo fair against TensorRT-LLM?

Oct 18 '23 02:10 jstumpin

FasterTransformer FasterTransformer copied to clipboard

What's the difference between FasterTransformer and TensorRT

FasterTransformer
FasterTransformer copied to clipboard