higress
higress copied to clipboard
【GLCC】AI 缓存 Wasm 插件对接更多向量数据库/向量存储、搜索组件
GitLink编程夏令营(GLCC),是在CCF中国计算机学会指导下,由CCF开源发展委员会(CCF ODC)举办的面向全国高校学生的暑期编程活动。活动将覆盖近千所高校,并联合各大开源基金会、开源企业、开源社区、开源专家,旨在鼓励青年学生通过参加真实的开源软件开发,提升自身技术能力,为开源社区输送优秀人才。为青年学生提供开放友好的交流平台,希望进一步推动国内开源社区的繁荣发展。
Higress将会参加本次的“GitLink编程夏令营(GLCC)”
背景
Higress 最近正在开发一款基于向量相似度实现 LLM 结果召回的 Wasm 插件 AI Cache(#1040)。目前使用的核心向量召回模块为Redis。但为了适配更多的扩展需求,需要对接更多种类的向量数据库或支持向量存储、搜索的组件。目前 Wasm 插件提供了对外发送 HTTP 请求的能力,所以可以很方便的对接提供 REST API 的相关产品。
目标
在 AI Cache 插件中对接一系列向量数据库或支持向量存储、搜索的组件。
难度
中等
导师
董艺荃(@CH3CHO) [email protected]
产出要求
基于 AI Cache 插件中的向量存储操作接口,支持对以下向量数据库/存储搜索组件的进行操作,以实现基于向量相似度实现 LLM 结果召回功能:
- AI Cache 插件对接Elasticsearch
- ~AI Cache 插件对接Milvus~
- AI Cache 插件对接Weaviate
- AI Cache 插件对接Pinecone
- AI Cache 插件对接Qdrant
- AI Cache 插件对接ScaNN
- AI Cache 插件对接Chroma
- AI Cache 插件对接阿里云向量检索服务
- AI Cache 插件对接阿里云 Lindorm
能力要求
- 熟练掌握 Go 语言
- 了解对接各种向量数据库的方式的优先考虑
- 有基于向量相似度进行 RAG 应用开发经验的优先考虑