TileSparsity icon indicating copy to clipboard operation
TileSparsity copied to clipboard

速度和tensorRT相比起来如何?

Open leiwen83 opened this issue 4 years ago • 1 comments

如题, 另外好支持int8推理吗?

Thx, Lei

leiwen83 avatar Aug 26 '21 08:08 leiwen83

由于 TensorRT或者cublas不开源,目前的版本是基于NVIDIA cutlass 1.3开发,性能与基于cublas 的TensorRT的版本有一定差距。也是由于cutlass版本的问题,目前只支持FP16和FP32。

clevercool avatar Aug 28 '21 17:08 clevercool