FastGPT 有没有好一点的可以识别图片信息的本地模型

使用fastgpt--onapi调用ollama本地模型或者 xference模型，下载了好几个多模态的模型，图片识别效果都不准确。有没有好一点的可以识别图片信息的模型

据说qwen2-vl 效果可以，但是目前ollama还不支持，而xinference下载又总报错

以下几个都测试了，效果不好 minicpm-v:8b llava:13b bakllava blackened/llama-3-8b-gpt-4o-ru1.0:latest gemma2:27b llava-llama3

Sep 25 '24 07:09 goactiongo

minicpm-v:8b-2.6-fp16我用的这个，感觉还可以，反正是比llava:34b好的多

Sep 26 '24 06:09 sevenclockseven

多谢抽空测下

---原始邮件--- 发件人: @.> 发送时间: 2024年9月26日(周四) 下午2:25 收件人: @.>; 抄送: @.@.>; 主题: Re: [labring/FastGPT] 有没有好一点的可以识别图片信息的本地模型 (Issue #2792)

minicpm-v:8b-2.6-fp16我用的这个，感觉还可以，反正是比llava:34b好的多

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Sep 26 '24 07:09 goactiongo

目前不是公认qwen2.5 7b 同等体积识别效果最好么?

Sep 26 '24 08:09 sunk926