ChatGLM-6B [Feature] 支持视觉信息输入和理解，类似于GPT-4

[Feature] 支持视觉信息输入和理解，类似于GPT-4

Open feizc opened this issue 1 year ago • 2 comments

通过微调模型，支持视觉信息输入，类似于GPT-4。

目前已经在LLaMA语言模型上进行尝试，且结果不错。参考：https://github.com/feizc/Visual-LLaMA

在迁移到chatglm的时候遇到问题，是否有计划让chatglm支持视觉理解？

也欢迎大家提供和讨论可行的方案。

Apr 07 '23 01:04 feizc

这个不错

Apr 07 '23 10:04 YIZXIY

@feizc 你好！可以分享一下遇到了什么问题吗？

Apr 22 '23 19:04 ZhengQinLai

VisualGLM-6B支持图像输入，欢迎体验。

Aug 16 '23 06:08 zhangch9