Ziqiao Peng
Ziqiao Peng
Hi! How can I get yolo to output bbox? I can only output images.
优化分割算法或者训练torso可以改善该问题。
看起来不是推理的问题,是视频拼接的问题,在那一帧应该是用的别的帧的图片,然后导致突然的抖动,可以检查一下特定帧对应的图片。
如果方便的话可以把原视频发送到我的邮箱[email protected],以对问题进行定位。
https://github.com/ZiqiaoPeng/SyncTalk/assets/93774583/a3f6b9c9-0422-4be0-9067-035bbc42629e 我使用hubert训练的结果没有问题,头部稳定,唇形同步,眼睛正常眨眼。
> > 我使用hubert训练的结果没有问题,头部稳定,唇形同步,眼睛正常眨眼。 > > @ZiqiaoPeng 请问素材你做了特殊处理吗?能详细说一下你的预训练过程吗?谢谢!~ 没有特殊处理,step1训练6w步,step2训练到10w步。
请pull最新的代码,并重新运行数据预处理流程,应该会解决此问题。
You can try using different audio encoders.
Please see the latest readme. Training torso can solve the problem of double chin.
Please see the latest readme. Training torso can solve the problem of double chin.