aiwiki
aiwiki copied to clipboard
Hot StableDiffusion Algos
Stable Diffusion 原理
- Lantent Space - 潜在空间
- Diffusion Model - 像素空间 (Imagen/DALL-E)
- Latent Diffusion Model - 潜在扩散模型
- 条件扩散
扩散: 指物理现象中物质向密度低的方向散开
Arch
- VAE:
图像在像素空间和潜在空间转换的工具
- UNet:
预测出的噪声残差从原噪声矩阵中去除,得到逐步去噪后的图像Latent Feature
- CLIP Text Encoder
VAE
- Pixel Space <=> Latent Space
Unet
Steps
- 创建一个可用的潜在空间表示,即训练一个
Autoencoder
, 把图像从像素空间(Pixel Space) 转到 潜在空间表示(Laten Space) - 对潜在空间中图片添加噪声,进行扩散过程 - Diffusion Process
- 训练一个
CLIP
模型 将输入 text 转换为 去噪过程条件 - 训练模型基于条件对图像去噪
Denoising
, 获取图片潜在空间表示- 条件问
text
, 即text2img
- 条件为
img(+text)
, 即img2img
- 条件问
- Inference
- 输入为
去噪条件
, 去噪获取图片潜在空间表示,经过图像解码器转换获取最终图像
- 输入为