VisualGLM-6B icon indicating copy to clipboard operation
VisualGLM-6B copied to clipboard

请教一下默认的image encoder是什么?

Open ldfandian opened this issue 1 year ago • 3 comments

是EVA CLIP这个超大的模型不?看了下代码,没有直接提到呢~

ldfandian avatar May 24 '23 09:05 ldfandian

同问。模型的架构能提供一下不,这个和minigpt-4是一样的?

freelancerllm avatar May 24 '23 10:05 freelancerllm

是的,本项目和minigpt-4都是基于BLIP2的思路,结构类似。具体可以看model文件夹下的代码。

Sleepychord avatar May 24 '23 10:05 Sleepychord

是的,本项目和minigpt-4都是基于BLIP2的思路,结构类似。具体可以看model文件夹下的代码。

看层数配置起来就是EVA-CLIP。。。暴大的模型 image

ldfandian avatar May 24 '23 10:05 ldfandian