HanksonYe issues

Results 2 issues of


                                            HanksonYe

为什么audio_driven的推理任务中2D组件使用自己训练好的生成的图像画面就几乎静止？

我在进行audio_driven的推理任务中发现一个问题：如果denoising_unet， reference_unet，pose_guider这三个2D组件我使用的是我在train_stage1中训练好的版本，不论我的motion_module使用的是pretrained的motion_module.pth还是基于train_stage1 checkpoint训练好的motion_module.pth，我生成的视频几乎就是完全静止的，画面只有一些轻微的扰动。

为什么我的模型训练完了之后画面抖动但是面部几乎不动

我在使用audio-driven的任务中，如果我直接进行推理，那么结果还是正常的；但是如果我进行了训练之后再进行推理，我就会发现画面开始抖动了，但是画面几乎不动了；我是直接跳过了stage1直接训练stage2的，所以是这里出现的问题吗？另外我的训练的训练集的图像是1920*1080的，这个也会有影响吗？需要把所有的视频都弄成512*512的才能做吗？非常感谢各位好心人解答。