16、显微镜下的Stable Diffusion(二):从图像变体到神雕侠侣(SDXL)你好,我是南柯。 在上一讲,我们详细探讨了Stable Diffusion模型的核心技术,包括无分类器引导、UNet模块构成、负向描述词原理等。 事实上,随着AI绘画技术的不断发展,Stable Diffusion模型也在持续进化,比如2023年6月...2026-01-24AI绘画核心技术与实战
15、显微镜下的Stable Diffusion(一):惊艳效果下的关键技术揭秘你好,我是南柯。 我们之前已经学习了Stable Diffusion的核心组成模块,比如CLIP、VAE、UNet、注意力机制、采样器等等。在第二个实战项目(可以回顾 [12讲]复习),我们已经动手训练了自己的扩散模型,也基于基础模型微调了我们自己的...2026-01-24AI绘画核心技术与实战
14、挑战者Imagen:为什么会后来居上你好,我是南柯。 上一讲我们一起探索了OpenAI推出的DALL-E 2背后的技术原理。仅仅过去一个月,在2022年5月,Google便发布了自己的AI绘画模型Imagen。Imagen在效果上显著优于DALL-E 2,并且通过实验证明,只要文本模型...2026-01-24AI绘画核心技术与实战
13、前浪DALL、E 2:帮你魔改经典画作你好,我是南柯。 通过上一章的学习,我们已经掌握了AI绘画的基础知识,了解了扩散模型、CLIP模型、自回归模型等模块的基本原理。从今天开始我们进入进阶篇的学习,我会带你基于已经了解的基础知识,继续探索业界最新最火的AI绘画模型。学完这部分内容,AI绘...2026-01-24AI绘画核心技术与实战
12、实战项目(二):动手训练一个你自己的扩散模型你好,我是南柯。 前面几讲,我们已经了解了扩散模型的算法原理和组成模块,学习了Stable Diffusion模型新增的CLIP和VAE模块。掌握了这些知识,相信你也一定跃跃欲试,想要训练一个属于自己的AI绘画模型。 这一讲,我们会将前几讲的知识串联...2026-01-24AI绘画核心技术与实战
11、VAE系列:如何压缩图像给GPU腾腾地方你好,我是南柯。 在前几讲中,我们已经学习了Transformer、UNet、Clip三个关键模块。在Stable Diffusion的知识地图上,还差最后的一环,便是今天的主角VAE模块。 在Stable Diffusion中,所有的去噪和加噪过程...2026-01-24AI绘画核心技术与实战
10、CLIP:让AI绘画模型乖乖听你的话你好,我是南柯。 今天我们要学习的是OpenAI在2021年提出的CLIP算法。在AI绘画的过程中,CLIP的作用是理解我们给到模型的prompt指令,将prompt指令编码为模型能理解的“语言”。 但你可能不知道,最早提出CLIP模型并不是帮助AI...2026-01-24AI绘画核心技术与实战
9、采样器:龟兔赛跑,如何选择更好更快的采样器你好,我是南柯。 热身篇我们学习过WebUI,你会发现里面有多种可供选择的采样器方法,包括Euler a、DPM、DDIM等等。 我们已经多次使用Stable Diffusion进行AI绘画,采样器存在的价值就是从噪声出发,逐步去噪,得到一张清晰的...2026-01-24AI绘画核心技术与实战
8、巧用神经网络:如何用UNet预测噪声你好,我是南柯。 前面我们已经学习了扩散模型加噪和去噪的过程,也了解了Transformer的基本原理。之前我还埋下了一个伏笔,那便是使用UNet网络预测每一步的噪声。 今天我就来为你解读UNet的核心知识。在这一讲,我们主要解决后面这三个问题。 ...2026-01-24AI绘画核心技术与实战
7、AIGC的核心魔法:搞懂Transformer你好,我是南柯。 前两讲中,我们已经学习了扩散模型的加噪去噪过程,了解了UNet模型用于预测噪声的算法原理。事实上,Stable Diffusion模型在原始的UNet模型中加入了Transformer结构(至于怎么引入的,我们等[下一讲]学完UNe...2026-01-24AI绘画核心技术与实战