jibingyangsf

Results 3 comments of jibingyangsf

请问这套384 有在不改网络结构和损失函数情况下 收敛的很好的吗

> 2万个不到5秒的视频文件 跑了36万step 我中途修改了一下训练集 增加了一些高质量的训练数据。按照作者的说法我的训练集数据可能还远远不够 。我先试试吧 毕竟炼丹靠玄学 请问 作者这套源码 不需要调整网络结构和损失函数 就可以直接训练384吗?

> > 视频的码率够不够 声音是否同步 更重要的是 视频每一帧里面的脸有没有 是不是同一个人,是不是有多人? > > 感谢,码率、人脸我都检查过,全1080p,音画syncnet_python检测我省略了,通过降低学习率过了0.69的坎。但现在训练很慢,160w steps才到了0.44左右,而且貌似有过拟合的趋势,看见你的恢复怀疑是数据集质量的问题,能请教一下您的音画同步步骤吗 这直接用syncnet_python 去跑 一个开源项目 AV offset 0 就代表同步了。我也有个问题 作者的源代码确定可以不用改就能跑288或者384 512的训练吗? 不是说网络结构和损失函数都要和96*96 有区别吗?这里你懂不?