FlagEmbedding 希望能使用vllm加速llm reranker

Aug 15 '24 02:08 ericxk

+1

Aug 15 '24 07:08 skycore9

+1

Aug 17 '24 14:08 eureka336

+1

Aug 18 '24 08:08 Cloopen-ReLiNK

组内同事帮忙实现了，有一些小改动

Sep 02 '24 11:09 ericxk

组内同事帮忙实现了，有一些小改动

相比TensorRT和onnx有多大提升啊。能否提供一下参考代码

Sep 13 '24 16:09 EvanSong77

组内同事帮忙实现了，有一些小改动

相比TensorRT和onnx有多大提升啊。能否提供一下参考代码

avg p90 p99等耗时指标降低一半多，收益挺明显的，比预期高（之前以为只返回一个token，耗时优化应该不太明显)，强力推荐

Oct 17 '24 07:10 ericxk

组内同事帮忙实现了，有一些小改动

相比TensorRT和onnx有多大提升啊。能否提供一下参考代码

avg p90 p99等耗时指标降低一半多，收益挺明显的，比预期高（之前以为只返回一个token，耗时优化应该不太明显)，强力推荐

可否分享一下示例代码

Oct 17 '24 08:10 EvanSong77

可否分享一下示例代码 +1

Jan 20 '25 07:01 zhouyuustc

去用vllm部署吧，现在vllm已经支持bge reranker了

Jan 20 '25 07:01 EvanSong77

去用vllm部署吧，现在vllm已经支持bge reranker了

有示例代码吗

Feb 18 '25 08:02 gaopeiyang