MiniCPM-o
MiniCPM-o copied to clipboard
端模型跑vlm的延时
我们在用小米14 pro测试了下llama.cpp以及ollama跑minicpm。 模型加载大约10s,图片编码大约10s。
相比llm,这个速度还是非常慢,我们有更好的方案解决图片编码问题吗,或者咱们有端模型群吗?