MNN
MNN copied to clipboard
VLM推理本地图片应该怎么写prompt.txt啊?这样写对吗?描述的不准让我怀疑我是不是写错了
这样写对吗?描述的不准让我怀疑我是不是写错了 <img><hw>280, 420</hw>/home/work/image/mao.jpg</img> 描述画面
把 hw 放后面试下
/home/work/image/mao.jpg
看起来对的,编译时候是不是没开启 视觉处理的宏
这样写对吗?描述的不准让我怀疑我是不是写错了 <img><hw>280, 420</hw>/home/work/image/mao.jpg</img> 描述画面
你好,我目前也遇到了这个问题,请问您是怎么解决的?可以参考一下吗
是不是多了个逗号,也可以不加 hw 试试,
看起来对的,编译时候是不是没开启 视觉处理的宏
看来是的,按照 https://github.com/alibaba/MNN/issues/3915 的编译选项能成功运行了,但是我在MNN-Doc中并没看到任何地方提及-DLLM_SUPPORT_VISION=true相关,不过特别提示了LLM和OMNI