dreambooth-for-diffusion 关于输入图像维度的问题

关于输入图像维度的问题

Open littlewater3 opened this issue 1 year ago • 2 comments

看到有说明输入的图像需要转化为512512维度的图像。我有大概数千张3232的带类别标签的图像，如何采用这些图像去重新训练stable diffusion model？需要缩放为512512吗？还是说有办法拿这些3232的图像直接去训练。如果去训练改模型，vae、unet、text encoder这些权重哪些需要改变？我是刚入门的小白，望大佬指教

Apr 24 '23 16:04 littlewater3

dreambooth-for-diffusion dreambooth-for-diffusion copied to clipboard

关于输入图像维度的问题

dreambooth-for-diffusion
dreambooth-for-diffusion copied to clipboard