echomimic icon indicating copy to clipboard operation
echomimic copied to clipboard

训练代码复现

Open JWSunny opened this issue 1 year ago • 8 comments

感谢分享~ 1、参考hallo2和[Moore-AnimateAnyone进行第2阶段代码复现,denoise_unet部分的第一个参数latent是跟2个开源项目一致吗? (1)self.denoising_unet第1个参数:noisy_latents = train_noise_scheduler.add_noise(latents, noise, timesteps) (2)权重冻结: vae.requires_grad_(False) denoising_unet.requires_grad_(False) reference_unet.requires_grad_(False) face_locator.requires_grad_(False)

# Set motion module learnable
for name, module in denoising_unet.named_modules():
    if "motion_modules" in name:
        for params in module.parameters():
            params.requires_grad = True

2、使用跟hallo2相同的原图加噪与denoise_unet预测的值算mse loss,第2批数据后就出现loss为nan的情况; mse_loss: tensor(0.2483, device='cuda:0', dtype=torch.float16, grad_fn=<MseLossBackward0>) {'global_step:1, train_loss: 0.248291015625'} mse_loss: tensor(nan, device='cuda:0', dtype=torch.float16, grad_fn=<MseLossBackward0>) {'global_step:2, train_loss: nan'}

3、请问能参考哪个开源进行实现,再次感谢!

JWSunny avatar Oct 30 '24 07:10 JWSunny

上述问题解决了,想咨询论文中说的8卡A100显存多大的,8卡跑的batch_size是4吗?目前在进行vae.decode单卡A100-80G总报内存溢出!!

JWSunny avatar Oct 31 '24 12:10 JWSunny

您好,想请问这个项目的训练代码需要重构吗?

11898d avatar Nov 05 '24 09:11 11898d

您好,想请问这个项目的训练代码需要重构吗?

需要,参考提到的几个开源,重写整个训练框架,提供的只是推理代码!

JWSunny avatar Nov 05 '24 09:11 JWSunny

需要,参考提到的几个开源,重写整个训练框架,提供的只是推理代码!

训练框架参考animateanyone,数据处理参考Hallo2,是这个意思吗?复现出来的效果如何?

bbb-stack avatar Dec 02 '24 09:12 bbb-stack

第一第二阶段都用hallo2可以吗

JhonWick-7 avatar Feb 01 '25 10:02 JhonWick-7

您好,想请问这个项目的训练代码需要重构吗?

需要,参考提到的几个开源,重写整个训练框架,提供的只是推理代码!

可以参考一下训练代码吗

JhonWick-7 avatar Feb 04 '25 09:02 JhonWick-7

你好,想请教一下为什么基于hallo2进行复现而不是hallo呢?

kenxxxxx avatar Feb 12 '25 14:02 kenxxxxx

你好,想请教一下为什么基于hallo2进行复现而不是hallo呢?

1和2 差不多

JhonWick-7 avatar Feb 25 '25 10:02 JhonWick-7