firefly comments

Results 8 comments of


                                            firefly

【onnx模型】关于bge-reranker-v2-m3模型转onnx模型相关对比情况讨论

> > onnx我们已经不用了，现在用的是vllm框架部署（现在已经支持bge的reranker模型了），实测效果比onnx要好不少，显存占用更少更稳定 > > 请问可以支持多卡部署 `bge-reranker` 吗？有部署的代码能参考一下嘛。我想试试能不能启动~ [@EvanSong77](https://github.com/EvanSong77) 这是我一个项目的docker-compose.yaml文件作为参考 ```yaml services: QwQ-32B: container_name: Qwen-QwQ-32B-int4 image: vllm/vllm-openai runtime: nvidia # ports: # - 8000:8000 network_mode: "host" volumes: - "/workspace/Qwen-QwQ-32B-int4:/root/.cache/huggingface/Qwen-QwQ-32B-int4/:ro" environment:...

firefly

【onnx模型】关于bge-reranker-v2-m3模型转onnx模型相关对比情况讨论

询问一下大家现在部署QQ的会被封吗？

[Feature] mcp agent，后续会支持吗？

[BUG] Docker 部署时无法通过环境变量或 config.yaml 配置外部数据库，始终使用本地 sqlite

[Feature] 能否添加对通义千问的支持

嵌入模型api接口支持

嵌入模型api接口支持

嵌入模型api接口支持