CookMaker
CookMaker
> > 会忽略头部的模型参数 > > > 好,我查看了所有的问题,对于训练问题1,作者说会在六月之前开放audio2motion的代码, 对于问题2,我也想了解原因,论文中有一定的篇幅进行解释,但是我并没有深刻的体会对于问题3的理解 ,我理解为躯干是在头部的基础上进行训练的,两者并不是独立分开的,而躯干实际上是最终训练出的模型 > > 刚接触这个项目不久,如果你有更深入的理解,欢迎讨论呀 > > 您好,有一些关于环境安装的问题,请问您有时间吗 you can submit an issue and lots of people(include me) would help
> @Net-Maker 请教一下,在该项目训练过程中,建议是有个3min+的视频进行训练。 1、那么这个素材上有什么特殊的要求吗?是尽可能的多说不同的单词文字/展示不同的表情,还是简单的随意说一段3分钟的话? 2、素材视频是否直接拍摄512x512分辨率(含人脸) 对于问题1,素材要求肯定是多说话,然后头部要一直面对镜头,不能太偏,就自然地说话就好了 对于问题2,512x512是对于头部和肩膀的分辨率,按照我的理解头部占整个视频的比例还是挺小的,所以原始分辨率视你自己情况
> @Net-Maker I've encountered several issues during the training process and would like some advice: > > 1、At the beginning of training, the log shows every single step, for example:...
你修改了config文件,但是两个数值没对上吧
这个问题看起来像是你把blink_embedding_dim改了,head的dim和torso的dim不一致导致的
看看你的损失是不是出问题了,要么就是你拿head推理的,而不是torso
你的推理命令的--torso_ckpt 和--head_ckpt有没有填错呢
是的,我遇到的也是忽大忽小的问题,我这里描述的就是这个问题
你可以增加landmark的平滑窗口,一定程度上可以改善忽大忽小的问题