[Other]为啥使用 deepseek 不能上传图片
我使用 deepseek 的模型,在对话框上传图片不能使用,deepseek 官网是可以用的。这个是 chatbox 限制的吗?
模型不支持,deepseek没有多模态能力吧。 GEMINI可以
确认了一下 确实是不支持目前还
我使用chabox接入的是字节火山方舟里面的deepseek-r1模型,现在chabox安卓和pc端对于图片这一块也是无法识别,我不知道这个问题是不是deepseek的原因,如果是deepseek的原因,为啥deepseek官网对话窗口可以贴图片提问呢,有人能给我解答一下这个问题吗
官方服务的图片理解,应该是有个单独的模型服务在做。
我发现了这个问题,官网是可以识别图片并生成表格的,但是chatbox不行,而且整个对话报错,导致整个对话废了
之后会支持对非视觉模型的图片输入先做OCR
之后会支持对非视觉模型的图片输入先做OCR
求求了,这个功能太需要了!只是需要ctrl+v粘贴或者上传一个图片,然后文本框输入文字。chatbox前端调用一个cpu运行的小ocr模型把文字提取出来,跟着我输入的文字一起当作prompt发送给后端的LLM。
我网上找了所有的的LLM integeration居然一个支持这个功能的都没有(anythingLLM说是有但是试了半天还是不行),要哭了。。。
之后会支持对非视觉模型的图片输入先做OCR
推荐:https://github.com/Topdu/OpenOCR 模型小,效果好,成果新。
主要是我不会ts, js。不然我就上手写了,呜呜呜。。。