lightseq icon indicating copy to clipboard operation
lightseq copied to clipboard

lightseq在1080ti上性能还不如原生pytorch

Open kitty-eu-org opened this issue 3 years ago • 5 comments

我在使用https://github.com/bytedance/lightseq/tree/master/examples/inference/python里面的代码导出bert-base-uncased的hdf5模型文件后,进行测试时发现其在1080ti的性能表现还不如原生的transformers,如下图: image 是显卡型号或者是cuda版本问题吗?或者说我的代码问题,我基本用的就是examples里面的代码

kitty-eu-org avatar Oct 14 '21 04:10 kitty-eu-org

Please check #184

Taka152 avatar Oct 14 '21 06:10 Taka152

我也用的是1080ti,cuda11.0,tensorflow2.4,在example里面的bart测试上也不如huggingface版本

zhouyonglong avatar Mar 17 '22 08:03 zhouyonglong

你看下#184

kitty-eu-org avatar Mar 18 '22 01:03 kitty-eu-org

image image 1080和1080ti 算力不支持fp16,你可以试试pytorch分别用fp16和fp32,fp32应该也会比fp16快,lightseq底层用的cublas库,是需要硬件的算力支持的,

dingjingzhen avatar Apr 08 '22 10:04 dingjingzhen

我用的GTX 1660Ti显卡,转换后的模型时间也是比Hugging Face 的慢,按说算力达到了,win10上以前运行程序显示的算力是7.5

DidaDidaDidaD avatar Apr 16 '22 02:04 DidaDidaDidaD