张子良 comments

Results 25 comments of


                                            张子良

Optimise inference time

这个项目，默认有一个缓冲机制，第二次同一个驱动视频，会服用第一次训练的结果，具体对应1-4步骤，你可以看具体看一下。

写了一版训练代码，可是合成视频上半张脸和下半张脸感觉是分离的，而且不连贯抖动明显

视频素材的问题，好像是。HDTF的人物脸色一般都比较深

你好，人脸处理完之后，很多细节丢失了，有没有参数或者方法保留细节

> > > > 是不是在这里下采样时丢失的： crop_frame = cv2.resize(crop_frame,(256,256),interpolation = cv2.INTER_LANCZOS4) #raymond > > > > 不下采样，怎么做，必须下采样吗？ > > > > > > > > > 这里是因为模型的输入必须是一个固定的size，在目前开源的模型中是256X256。 > > > >...

预处理阶段视频拆帧

有一个参数是是否复用，预处理的数据，你具体检查一下，默认值设置为True、可以起到加速的作用。--use_saved_coord

1.模型路径问题？ 2.网络连接问题？3.加速器命令行工具错误？我在使用魔法啊，但是连接不上Hunggingface的模型。

手动下载吧。提前存储到对应目录下面。

内存释放问题

推理过程中，回加载模型，模型大小bs=4的时候，大概7G，推理结束会自动释放。

FileNotFoundError: ./models/dwpose/dw-ll_ucoco_384.pth can not be found.

相对路径的问题，你把models的位置，上提一级，到项目的跟文件夹即可。

试了一圈，wav2lip、video-retalking、geneface++、musetalk等等，感觉没有一个能直接落地的

微调目前还没有见到可行的，泛型依赖的是高清数据，都需要自己训练的。成本都很高，凭啥开源。

动物的口型驱动

动物口型目前已知的，好像只有facebook发过一个，具体名字忘记了。你搜一下。