请问能否对特定的rag服务进行召回片段评估呢？

Open ferrymo opened this issue 3 weeks ago • 2 comments

问题描述 我现在基于milvus加上重排序模型等做了一个自己的rag服务，我想通过几篇已再rag库中的文献进行生产QA对，想看看rag对应的召回率和准确率进行评估,咱们得平台是否能完成这类场景的评估或者协助完成呢？ hello @ConardLi

Nov 27 '25 11:11 ferrymo

目前还不支持

Nov 28 '25 14:11 ConardLi

目前还不支持

好的谢谢，后续有计划做相关的事情吗，我现在正在集成Ragas做这件事情，我这边如果做成后续可以变成咱们的生态圈产物哈

Dec 01 '25 03:12 ferrymo