MiniCPM-V
MiniCPM-V copied to clipboard
MiniCPM-V 4.5: A GPT-4o Level MLLM for Single Image, Multi Image and High-FPS Video Understanding on Your Phone
首先**非常感谢**贵团队做出的卓越的贡献,我打算将其作为OCR使用读取图片上的内容并且给出完整的信息 但是尝试多个prompt之后还是无法有效的输出完整的信息,想请教下有什么解决方法或者正确的使用方式吗? > 测试OCR图片源自 第一页
http://120.92.209.146/ 这个demo地址的webui我想测试下。
会支持VLLM推理吗
RT 看到 swift 里面有 V1 的微调代码,请问在 V2.0 上可以直接使用么,还是需要重新开发一下?
请问MiniCPM-V如何使用流式的方式生成?像是使用transformers的streamer之类的。 另外,好像model.chat输入temperature或top_p是不生效的,看代码是已经写死了。 
我下载了3b模型跑了官方的MME测试集,使用prompt为官方的默认prompt,算出来的分数为1378.67,和给出的1452差别较大。请问是测试结果使用的prompt不一致导致的吗?
Hi All, I developed the fine-tuning code for minicpmv based on the provided Chat code. Tested to run successfully on 8XA100 GPU environment. The currently implemented code only supports single...
depolyed -> deployed