Elric

Results 12 comments of Elric

@seven-xu Hello. Do you fix this Problem? I face in this problem currently!

成都地区也无法访问, ![image](https://github.com/OpenBMB/MiniCPM-V/assets/16486492/3ceaa7ae-5279-472d-8899-d9f6d5f84454)

这个问题有解决吗?我也遇到类似的问题了

> At present, we are unable to support rapid deployment to small mobile devices. However, we are actively exploring options to include this functionality in future updates. Thank you for...

> 已经进行处理了的,可以在 llmexport.py 和 vision.py 里面找一下 ![Image](https://github.com/user-attachments/assets/57967e2b-5b44-4170-9e41-397f01c93ab7) 我们又check了一下,确实没有实现 (M-ROPE),M-ROPE 是在模块D部分:合并文本和图像 embedding的时候将位置编码ID重构成三维向量[t,h,w] 举个例子: prompt_head_len = 5 图片编码成 2 * 2 = 4 个 token ```python import torch position_ids = torch.arange(0, 10,...

> 检查了代码,我们之前支持的Qwen2-VL和Qwen2.5-VL没有支持视频输出,单次推理只支持单张图片输入;因此位置编码没有使用m_rope,现在这部分功能已经在支持了 感谢回复 期待后续版本的更新

> 代码实现: > > [MNN/transformers/llm/engine/src/omni.cpp](https://github.com/alibaba/MNN/blob/ebb8c8ff86b9bd15d6f3ca47a552e9ee11dbbefa/transformers/llm/engine/src/omni.cpp#L519) > > Line 519 in [ebb8c8f](/alibaba/MNN/commit/ebb8c8ff86b9bd15d6f3ca47a552e9ee11dbbefa) > > VARP Omni::gen_position_ids(int seq_len) { 大佬,apps\Android\MnnLlmChat 这个apk 好多bug,根本编译不了,是不是漏传了很多文件啊: 比如这个目录就没有传 com.alibaba.mnnllm.android.chat.model

> [#3506](https://github.com/alibaba/MNN/pull/3506) > > 已上传 这下可以了,感谢