ChatGLM-6B icon indicating copy to clipboard operation
ChatGLM-6B copied to clipboard

[Feature] 支持视觉信息输入和理解,类似于GPT-4

Open feizc opened this issue 1 year ago • 2 comments

Is your feature request related to a problem? Please describe.

通过微调模型,支持视觉信息输入,类似于GPT-4。

目前已经在LLaMA语言模型上进行尝试,且结果不错。 参考:https://github.com/feizc/Visual-LLaMA

在迁移到chatglm的时候遇到问题,是否有计划让chatglm支持视觉理解?

也欢迎大家提供和讨论可行的方案。

feizc avatar Apr 07 '23 01:04 feizc

这个不错

YIZXIY avatar Apr 07 '23 10:04 YIZXIY

@feizc 你好!可以分享一下遇到了什么问题吗?

ZhengQinLai avatar Apr 22 '23 19:04 ZhengQinLai

VisualGLM-6B支持图像输入,欢迎体验。

zhangch9 avatar Aug 16 '23 06:08 zhangch9