FastGPT icon indicating copy to clipboard operation
FastGPT copied to clipboard

有没有好一点的可以识别图片信息的本地模型

Open goactiongo opened this issue 1 year ago • 3 comments

使用fastgpt--onapi调用ollama本地模型 或者 xference模型 ,下载了好几个多模态的模型,图片识别效果都不准确。 有没有好一点的可以识别图片信息的模型

据说qwen2-vl 效果可以,但是目前ollama还不支持,而xinference下载又总报错

以下几个都测试了,效果不好 minicpm-v:8b llava:13b bakllava blackened/llama-3-8b-gpt-4o-ru1.0:latest gemma2:27b llava-llama3

goactiongo avatar Sep 25 '24 07:09 goactiongo

minicpm-v:8b-2.6-fp16我用的这个,感觉还可以,反正是比llava:34b好的多

sevenclockseven avatar Sep 26 '24 06:09 sevenclockseven

多谢  抽空测下

---原始邮件--- 发件人: @.> 发送时间: 2024年9月26日(周四) 下午2:25 收件人: @.>; 抄送: @.@.>; 主题: Re: [labring/FastGPT] 有没有好一点的可以识别图片信息的本地模型 (Issue #2792)

minicpm-v:8b-2.6-fp16我用的这个,感觉还可以,反正是比llava:34b好的多

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

goactiongo avatar Sep 26 '24 07:09 goactiongo

目前不是公认qwen2.5 7b 同等体积识别效果最好么?

sunk926 avatar Sep 26 '24 08:09 sunk926