ChatGLM-6B icon indicating copy to clipboard operation
ChatGLM-6B copied to clipboard

[Feature] 如何访问实时数据以便用于优化站内搜索?

Open Yuuon opened this issue 2 years ago • 1 comments
trafficstars

Is your feature request related to a problem? Please describe.

我们有一个用户生产内容平台(UGC),里面有大量的服装饰品家具类的物品,即使我们给这些物品进行了二级分类,标签,品牌归类等措施,但随着物品数量的增多用户可能在有指定需求时很难找到自己确实需要的物品,所以我们在考虑借用AI来进行搜索优化。首先的一个着眼点就是:能够让用户通过自然语言描述自己想要的物品,然后我们给出搜索结果。

Solutions

我们目前的想法是,通过网页的meta信息(首选,我们有一个浏览物品网页)或者准备一个数据库(备案)来准备需要的信息。具体的信息可能需要人工筹备(批量生成),包含的信息比如:{"物品ID":"idxxxxx", "类型":"服装", "子分类":"上衣", "作者":"xxx", "颜色":["红色","蓝色","黄色","黑色","绿色"], "标签":["运动衫"]} 。这样当用户在搜索是输入“我想要一件蓝色的运动衫”时,可以返回所有符合条件的物品列表。 当然上述只是一个比较简单的例子,它看上去可能不需要AI也能完成,但是用户的需求可能千奇百怪,考虑到这种情况,一个能理解用户需求的语言模型可能会有很大帮助。同时我们也会考虑扩展物品信息所包含的内容,来让AI更准确的识别,甚至推理用户需求来推荐关联物品。 我在这方面是完全的新手,完全不清楚上述需求现阶段能不能做(特别是接入数据,怎么接入,怎么读取,事先训练,还是实时遍历?),如果能做应该从何处开始下手。 希望各位不吝赐教。

Additional context

No response

Yuuon avatar Apr 07 '23 03:04 Yuuon

可以参考这个项目 https://github.com/imClumsyPanda/langchain-ChatGLM 能够利用 langchain 接入本地数据

imClumsyPanda avatar Apr 08 '23 01:04 imClumsyPanda