echomimic

echomimic copied to clipboard

Published 4 months ago •

Reame
Issues

训练代码复现

Open JWSunny opened this issue 1 year ago • 8 comments

感谢分享~ 1、参考hallo2和[Moore-AnimateAnyone进行第2阶段代码复现，denoise_unet部分的第一个参数latent是跟2个开源项目一致吗？（1）self.denoising_unet第1个参数：noisy_latents = train_noise_scheduler.add_noise(latents, noise, timesteps) （2）权重冻结： vae.requires_grad_(False) denoising_unet.requires_grad_(False) reference_unet.requires_grad_(False) face_locator.requires_grad_(False)

# Set motion module learnable
for name, module in denoising_unet.named_modules():
    if "motion_modules" in name:
        for params in module.parameters():
            params.requires_grad = True

2、使用跟hallo2相同的原图加噪与denoise_unet预测的值算mse loss，第2批数据后就出现loss为nan的情况； mse_loss: tensor(0.2483, device='cuda:0', dtype=torch.float16, grad_fn=<MseLossBackward0>) {'global_step:1, train_loss: 0.248291015625'} mse_loss: tensor(nan, device='cuda:0', dtype=torch.float16, grad_fn=<MseLossBackward0>) {'global_step:2, train_loss: nan'}

3、请问能参考哪个开源进行实现，再次感谢！

Oct 30 '24 07:10 JWSunny

上述问题解决了，想咨询论文中说的8卡A100显存多大的，8卡跑的batch_size是4吗？目前在进行vae.decode单卡A100-80G总报内存溢出！！

Oct 31 '24 12:10 JWSunny

您好，想请问这个项目的训练代码需要重构吗？

Nov 05 '24 09:11 11898d

您好，想请问这个项目的训练代码需要重构吗？

需要，参考提到的几个开源，重写整个训练框架，提供的只是推理代码！

Nov 05 '24 09:11 JWSunny

需要，参考提到的几个开源，重写整个训练框架，提供的只是推理代码！

训练框架参考animateanyone，数据处理参考Hallo2，是这个意思吗？复现出来的效果如何？

Dec 02 '24 09:12 bbb-stack

第一第二阶段都用hallo2可以吗

Feb 01 '25 10:02 JhonWick-7

您好，想请问这个项目的训练代码需要重构吗？

需要，参考提到的几个开源，重写整个训练框架，提供的只是推理代码！

可以参考一下训练代码吗

Feb 04 '25 09:02 JhonWick-7

你好，想请教一下为什么基于hallo2进行复现而不是hallo呢？

Feb 12 '25 14:02 kenxxxxx

你好，想请教一下为什么基于hallo2进行复现而不是hallo呢？

1和2 差不多

Feb 25 '25 10:02 JhonWick-7