Kent Dong

Results 238 comments of Kent Dong

> 跟这个PR似乎有重合的部分?#1248 > > 如这个PR里评论的,embeding和vector部分逻辑比较通用,建议放到独立的 ai-utils 目录下 #1248 是在这个 PR 的基础上扩展更多的 DB 支持。只是先提了个 PR。后续合并的顺序也是先合并这个,再合并 #1248。二者重合的部分会在这里合并。

> @Suchun-sv 可以增加一个多轮对话的缓存策略配置项,提供几种选项: > > 1. 关闭缓存 > 2. 使用最后一个问题作为缓存key > 3. 配置合并的对话数量,将合并后的对话作为缓存key 按照线下沟通结论,先实现 1、2 两个选项。3 作为进阶功能后续安排。

> 在配置中添加了`cacheKeyStrategy`配置,决定如何根据历史问题生成缓存键的策略。可选值: "lastQuestion" (使用最后一个问题), "allQuestions" (拼接所有问题) 或 "disable" (禁用缓存)。 在main.go中添加相应的逻辑为: > > ```go > var key string > if config.CacheKeyStrategy == "lastQuestion" { > key = bodyJson.Get("[email protected]").String() > } else...

试试把自定义服务 URL 改成这样的格式:https://openai.xxx.com/v1

我本地试了一下你的配置,没重现出来。你那边是否方便重新搭个环境试试呢? ![Image](https://github.com/user-attachments/assets/eca62f6f-df4d-464a-8426-dde6eff52d68) ![Image](https://github.com/user-attachments/assets/54d4726e-4431-4d04-b216-9d42872232a4)

> 你发出的请求 host是后端服务的地址吗? 这个我没看,但Deepseek服务端是可以正常响应的。

> > 你的后端不是真正的deepseek服务吗? > > 是真正的deepseek服务,正常应该host都是服务端的地址吧,应该是envoy的某个配置导致现在发出的请求都用了客户端请求的host 我看了一下,确实是保留了请求原始的 host,没有替换成 deepseek 的 host。不过我这里请求没有报错,是不是你们那边出向访问 deepseek 有代理或者网关,那边要求必须 host 正确才能出去吗? 不过我看代码应该是会替换 host 的。这个有点奇怪,我看看。

请问安装的 Gateway API 是哪个版本?目前 Higress 还不支持 1.2.0+。你可以先安装低一点的版本看看。