MiniCPM-V icon indicating copy to clipboard operation
MiniCPM-V copied to clipboard

💡 [REQUEST] - <title>视频推理时,采样逻辑是怎么样的?

Open foxbeing7 opened this issue 10 months ago • 1 comments

起始日期 | Start Date

No response

实现PR | Implementation PR

No response

相关Issues | Reference Issues

No response

摘要 | Summary

请问视频推理时,采样逻辑是怎么样的?视频足够长的情况下,MAX_NUM_FRAMES越大是否就效果越好?

基本示例 | Basic Example

如果固定了MAX_NUM_FRAMES,对同一个视频进行多次采样,得到的帧是否是一致的?谢谢

缺陷 | Drawbacks

11

未解决问题 | Unresolved questions

No response

foxbeing7 avatar Feb 11 '25 10:02 foxbeing7

@lihytotoro

Cuiunbo avatar Feb 17 '25 03:02 Cuiunbo

你好,在 2.6v 的 video-qa 模式下,如果视频足够长的话,或者视频时长秒数大于 MAX_NUM_FRAMES,视频会进行均匀抽帧。

YuzaChongyi avatar Jul 18 '25 06:07 YuzaChongyi