Le Ding
Le Ding
> 1. 可以,目前框架中embedding加载使用langchain中HuggingFaceEmbedding类,可以按照embedding的形式存储自己的embedding模型。自己训练的embedding确实对检索效果会有很大提升。 2. 需要重新定义FAISS中的similarity search相关函数,重新定义后可进行计算。 Le Ding ***@***.***>于2023年4月25日 周二14:42写道: > […](#) > 请问大佬: 1、我能否在这套框架内使用自己训练的文本向量化模型来替代默认的text2vec-large-chinese?这将大大提高在我特定领域内知识库搜索的精准度 2、能否自定义我自己的相似度计算公式?替换原有的比如inner product? 感谢 — Reply to this email directly, view it on GitHub , or...
@imClumsyPanda 大佬,我又来了,关于Faiss进行搜索这事(上方第2个问题),是否能够用我自己写的索引模型去替代Faiss呢?因为我similarity计算方式比较特殊。经尝试,通过改造Faiss的index.search函数来实现搜索的速度非常低效,不如自己写的方式快。 劳烦大佬解答 感谢。