MiniCPM-V icon indicating copy to clipboard operation
MiniCPM-V copied to clipboard

MiniCPM-V 4.5: A GPT-4o Level MLLM for Single Image, Multi Image and High-FPS Video Understanding on Your Phone

Results 480 MiniCPM-V issues
Sort by recently updated
recently updated
newest added

首先**非常感谢**贵团队做出的卓越的贡献,我打算将其作为OCR使用读取图片上的内容并且给出完整的信息 但是尝试多个prompt之后还是无法有效的输出完整的信息,想请教下有什么解决方法或者正确的使用方式吗? > 测试OCR图片源自 第一页

http://120.92.209.146/ 这个demo地址的webui我想测试下。

Such as data/training strategy/ablation study etc?

documentation

* 看到有fork了这个llama.cpp 的仓库

enhancement
feature

RT 看到 swift 里面有 V1 的微调代码,请问在 V2.0 上可以直接使用么,还是需要重新开发一下?

请问MiniCPM-V如何使用流式的方式生成?像是使用transformers的streamer之类的。 另外,好像model.chat输入temperature或top_p是不生效的,看代码是已经写死了。 ![image](https://github.com/OpenBMB/OmniLMM/assets/44219645/c7884a8d-8c6c-4657-8dee-f8c5fd38cf20)

feature

我下载了3b模型跑了官方的MME测试集,使用prompt为官方的默认prompt,算出来的分数为1378.67,和给出的1452差别较大。请问是测试结果使用的prompt不一致导致的吗?

Hi All, I developed the fine-tuning code for minicpmv based on the provided Chat code. Tested to run successfully on 8XA100 GPU environment. The currently implemented code only supports single...