chatbox icon indicating copy to clipboard operation
chatbox copied to clipboard

[Other]为啥使用 deepseek 不能上传图片

Open wcwplaygitbub opened this issue 10 months ago • 5 comments

我使用 deepseek 的模型,在对话框上传图片不能使用,deepseek 官网是可以用的。这个是 chatbox 限制的吗?

Image

wcwplaygitbub avatar Jan 21 '25 07:01 wcwplaygitbub

模型不支持,deepseek没有多模态能力吧。 GEMINI可以

aliluys avatar Jan 21 '25 07:01 aliluys

确认了一下 确实是不支持目前还

wcwplaygitbub avatar Jan 21 '25 07:01 wcwplaygitbub

我使用chabox接入的是字节火山方舟里面的deepseek-r1模型,现在chabox安卓和pc端对于图片这一块也是无法识别,我不知道这个问题是不是deepseek的原因,如果是deepseek的原因,为啥deepseek官网对话窗口可以贴图片提问呢,有人能给我解答一下这个问题吗

Image

Image

JIANBANGHAI avatar Feb 08 '25 10:02 JIANBANGHAI

官方服务的图片理解,应该是有个单独的模型服务在做。

viztazeng avatar Feb 13 '25 07:02 viztazeng

我发现了这个问题,官网是可以识别图片并生成表格的,但是chatbox不行,而且整个对话报错,导致整个对话废了

LargeOrange avatar Apr 07 '25 06:04 LargeOrange

之后会支持对非视觉模型的图片输入先做OCR

themez avatar Jun 10 '25 14:06 themez

之后会支持对非视觉模型的图片输入先做OCR

求求了,这个功能太需要了!只是需要ctrl+v粘贴或者上传一个图片,然后文本框输入文字。chatbox前端调用一个cpu运行的小ocr模型把文字提取出来,跟着我输入的文字一起当作prompt发送给后端的LLM。

我网上找了所有的的LLM integeration居然一个支持这个功能的都没有(anythingLLM说是有但是试了半天还是不行),要哭了。。。

Looong01 avatar Jun 19 '25 20:06 Looong01

之后会支持对非视觉模型的图片输入先做OCR

推荐:https://github.com/Topdu/OpenOCR 模型小,效果好,成果新。

主要是我不会ts, js。不然我就上手写了,呜呜呜。。。

Looong01 avatar Jun 19 '25 20:06 Looong01