张子良
张子良
这个项目,默认有一个缓冲机制,第二次同一个驱动视频,会服用第一次训练的结果,具体对应1-4步骤,你可以看具体看一下。
视频素材的问题,好像是。HDTF的人物脸色一般都比较深
结果抖动和位移问题
> > > > 是不是在这里下采样时丢失的: crop_frame = cv2.resize(crop_frame,(256,256),interpolation = cv2.INTER_LANCZOS4) #raymond > > > > 不下采样,怎么做,必须下采样吗? > > > > > > > > > 这里是因为模型的输入必须是一个固定的size,在目前开源的模型中是256X256。 > > > >...
有一个参数是是否复用,预处理的数据,你具体检查一下,默认值设置为True、可以起到加速的作用。--use_saved_coord
手动下载吧。提前存储到对应目录下面。
推理过程中,回加载模型,模型大小bs=4的时候,大概7G,推理结束会自动释放。
相对路径的问题,你把models的位置,上提一级,到项目的跟文件夹即可。
微调目前还没有见到可行的,泛型依赖的是高清数据,都需要自己训练的。成本都很高,凭啥开源。
动物口型目前已知的,好像只有facebook发过一个,具体名字忘记了。你搜一下。