MiniCPM-V
MiniCPM-V copied to clipboard
💡 [REQUEST] - <title>视频推理时,采样逻辑是怎么样的?
起始日期 | Start Date
No response
实现PR | Implementation PR
No response
相关Issues | Reference Issues
No response
摘要 | Summary
请问视频推理时,采样逻辑是怎么样的?视频足够长的情况下,MAX_NUM_FRAMES越大是否就效果越好?
基本示例 | Basic Example
如果固定了MAX_NUM_FRAMES,对同一个视频进行多次采样,得到的帧是否是一致的?谢谢
缺陷 | Drawbacks
11
未解决问题 | Unresolved questions
No response
@lihytotoro
你好,在 2.6v 的 video-qa 模式下,如果视频足够长的话,或者视频时长秒数大于 MAX_NUM_FRAMES,视频会进行均匀抽帧。