Langchain-Chatchat icon indicating copy to clipboard operation
Langchain-Chatchat copied to clipboard

支持word,那word里面的图片正常显示吗?

Open better319 opened this issue 1 year ago • 3 comments

如题,刚刚从隔壁转过来的,想先了解下

better319 avatar Apr 12 '23 01:04 better319

目前都是加载文本的功能,暂时还没加入读图和ocr

imClumsyPanda avatar Apr 12 '23 01:04 imClumsyPanda

不读图和ocr。就是直接把word里面有的部分插图,作为内容的一部分显示出来。 因为我看您的说明里面说是支持word格式的

better319 avatar Apr 12 '23 08:04 better319

可以参考 langchain 文档中关于 UnstructuredFileLoader 的介绍,我的理解是只有提取文奔。

better319 @.***>于2023年4月12日 周三16:40写道:

不读图和ocr。就是直接把word里面有的部分插图,作为内容的一部分显示出来。 因为我看您的说明里面说是支持word格式的

— Reply to this email directly, view it on GitHub https://github.com/imClumsyPanda/langchain-ChatGLM/issues/60#issuecomment-1504887589, or unsubscribe https://github.com/notifications/unsubscribe-auth/ABLH5EUJHU6LHQ2CXDDQS6TXAZS6ZANCNFSM6AAAAAAW27ZHAM . You are receiving this because you commented.Message ID: @.***>

imClumsyPanda avatar Apr 12 '23 08:04 imClumsyPanda

不读图和ocr。就是直接把word里面有的部分插图,作为内容的一部分显示出来。 因为我看您的说明里面说是支持word格式的

请问现在知道如何把word文档中的图片显示出来了吗?我的需求和您一样,不要求理解图像内容,只需要知道文档的某某位置有图就行了。比如把图片作为一个特殊的token【PIC】,那文本可能就是 “如下图所示:【PIC】\n从以上图片中能看出...”。

geolvr avatar Jun 30 '23 09:06 geolvr

同样需求 链接也会丢失

chenwenfeng avatar Sep 01 '23 05:09 chenwenfeng

目前不支持图片,图片的读取和分析暂时还不会更新,要等之后的版本

zRzRzRzRzRzRzR avatar Sep 27 '23 13:09 zRzRzRzRzRzRzR