aiwiki
aiwiki copied to clipboard

Published 20 hours ago •

Reame
Issues

Hot StableDiffusion Algos

Open junxnone opened this issue 1 year ago • 0 comments

Stable Diffusion 原理

Lantent Space - 潜在空间
Diffusion Model - 像素空间 (Imagen/DALL-E)
Latent Diffusion Model - 潜在扩散模型
条件扩散

扩散: 指物理现象中物质向密度低的方向散开

Arch

VAE: 图像在像素空间和潜在空间转换的工具
UNet: 预测出的噪声残差从原噪声矩阵中去除，得到逐步去噪后的图像Latent Feature
CLIP Text Encoder

VAE

Pixel Space <=> Latent Space

Unet

Steps

创建一个可用的潜在空间表示，即训练一个 Autoencoder, 把图像从像素空间(Pixel Space) 转到潜在空间表示(Laten Space)
对潜在空间中图片添加噪声，进行扩散过程 - Diffusion Process
训练一个 CLIP 模型将输入 text 转换为去噪过程条件
训练模型基于条件对图像去噪 Denoising, 获取图片潜在空间表示
- 条件问 text, 即 text2img
- 条件为 img(+text), 即 img2img
Inference
- 输入为 去噪条件, 去噪获取图片潜在空间表示，经过图像解码器转换获取最终图像

Inference

Reference

Oct 12 '23 06:10 junxnone