CogVideo icon indicating copy to clipboard operation
CogVideo copied to clipboard

社区盼开源图生视频模型如久旱盼甘霖 | We really need an image2video CogVideoX!

Open StarCycle opened this issue 5 months ago • 10 comments

Feature request / 功能建议

希望能看到CogVideoX的图生视频版本!!!

Motivation / 动机

社区盼开源图生视频模型如久旱盼甘霖,只生成6s短视频的文生视频模型在生产中用处比较有限,用6s短视频表达清楚创作者的意思是困难的。

只有具备图生视频能力,才能在拼接多段短视频时保持人物和场景的一致性,才能创作出长视频。从文生视频到图生视频,在技术上只是小小一步,但对创作者而言是能用和不能用的区别

至于训练生成更长短视频的模型(比如8秒,10秒)相对而言不是那么重要,一般一个镜头时长不会超过6秒。

Your contribution / 您的贡献

您发布初始版本以后,我可以试用或者提PR改进网络结构(如果您这边愿意提供微调数据)。

比如OpenSoraPlan为了实现根据前后帧inpaint中间帧,采用了如下的方式训练I2V模型: 68747470733a2f2f7332312e617831782e636f6d2f323032342f30382f31322f7041705a5a4a662e706e67

StarCycle avatar Aug 27 '24 13:08 StarCycle