easy-dataset
easy-dataset copied to clipboard
请问能否对特定的rag服务进行召回片段评估呢?
问题描述 我现在基于milvus加上重排序模型等做了一个自己的rag服务,我想通过几篇已再rag库中的文献进行生产QA对 ,想看看rag对应的召回率和准确率进行评估,咱们得平台是否能完成这类场景的评估或者协助完成呢? hello @ConardLi
目前还不支持
目前还不支持
好的谢谢,后续有计划做相关的事情吗,我现在正在集成Ragas做这件事情,我这边如果做成后续可以变成咱们的生态圈产物哈