一种基于潜空间扩散的文生图模型。
稳定扩散像街头画像摊:你报长相,先糊一团,再越擦越像。
用于文生图、草图和修图,文字就能出画。
Latent Diffusion Model它是 LDM 的代表实现,把扩散放进潜空间。
DiffusionDiffusion 提供从噪声逐步还原图像的基本思路。
Text-to-Image Generation它把文生图带进大众视野,门槛大幅降低。
CLIPCLIP 帮它理解提示词,并对齐图像语义。