FlagEmbedding icon indicating copy to clipboard operation
FlagEmbedding copied to clipboard

bge-reranker-v2-minicpm-layerwise 重排效率很低

Open ChengRuiLiang opened this issue 1 year ago • 6 comments

在A5000的显卡上,对100条数据进行重排序,需要5s才能完成

ChengRuiLiang avatar May 17 '24 01:05 ChengRuiLiang

有什么方法能够对它进行性能优化,有没有适合重排模型的推理加速框架

ChengRuiLiang avatar May 17 '24 01:05 ChengRuiLiang

想减少运行时间的话可以尝试使用低层输出、减少rerank的范围或使用bge-reranker-v2-m3 关于推理加速框架方面我们没有具体探究过

545999961 avatar May 17 '24 06:05 545999961

想减少运行时间的话可以尝试使用低层输出、减少rerank的范围或使用bge-reranker-v2-m3 关于推理加速框架方面我们没有具体探究过

非常感谢

ChengRuiLiang avatar May 17 '24 08:05 ChengRuiLiang

rerankerllm.compute_score 的use_dataloader=False 试试呢,我跑起来还挺快

yzspku avatar May 17 '24 09:05 yzspku

同求一个推理加速方案

newfyu avatar May 21 '24 09:05 newfyu

rerankerllm.compute_score 的use_dataloader=False 试试呢,我跑起来还挺快

默认就是 False

https://github.com/FlagOpen/FlagEmbedding/blob/399d12f3e238f7d5c82c86939691f195041e0159/FlagEmbedding/flag_reranker.py#L334

ycjcl868 avatar Aug 19 '24 06:08 ycjcl868