在潜空间中执行扩散生成的模型。
LDM 像在压缩草稿上作画:先在小小的潜空间里去噪成形,最后一步解码还原成完整图像。
支撑高清文生图,让生成更快、更省显存。
DiffusionLDM 把扩散过程从像素空间搬到潜空间。
VAEVAE 常负责把图像压缩进潜空间再解码。
Text-to-Image GenerationLDM 是许多高清文生图模型的效率底座。
U-NetU-Net 常在潜空间里预测噪声并逐步去噪。