DiffKD
DiffKD copied to clipboard
关于loss回传
作者您好,我观察代码 我的理解是KD loss是由denoised student feature 和teacher feature计算的, 在回传的时候 这个KD loss是否也会和ddim loss一起参与diffusion loss的更新呢