bisheng icon indicating copy to clipboard operation
bisheng copied to clipboard

知识库解析出现This model's maximum input ids length cannot be greater than 2048

Open rabbit-joe opened this issue 9 months ago • 6 comments

上传docx文件后预览分段结果出现This model's maximum input ids length cannot be greater than 2048,提交后在再重试解析,后台日志出现相同错误提示

Image,再dify中使用相同嵌入模型以及相同文件 可以正常解析

rabbit-joe avatar Mar 19 '25 07:03 rabbit-joe

并且想问一下es在bisheng中对知识库的作用是什么

rabbit-joe avatar Mar 19 '25 07:03 rabbit-joe

报错是因为总结的文档内容超过了知识库总结模型的上下文

es主要作用有两个:1、作为文本检索知识库用来补充向量检索;2、作为知识库分段管理的底层操作数据库。

zgqgit avatar Mar 19 '25 07:03 zgqgit

但是我不明白的是 同样的模型以及相同大小的文件,在dify上能解析呢,是因为处理方式不同吗

rabbit-joe avatar Mar 19 '25 08:03 rabbit-joe

我在减小文件大小的同时,知识库解析成功 但是在工作编排中使用的时候会出现以下问题

Image

Image

rabbit-joe avatar Mar 19 '25 08:03 rabbit-joe

毕昇这边在将文档内容入库之前会使用大模型对文档内容做个标题提取,你截图的报错日志是这个知识库总结模型的上下文超过长度了。模型->系统模型设置 里可以设置文档知识库总结模型,不配置则不总结。

工作流的运行报错,应该也是你最终传给模型的prompt拼接上检索到的chunk超过上下文长度了

zgqgit avatar Mar 19 '25 08:03 zgqgit

好的 大概明白了

rabbit-joe avatar Mar 19 '25 09:03 rabbit-joe