【SLAI Seminar】第二十七期回顾｜扩散模型的前沿探索：从得分估计到高效采样

2026年3月5日下午，SLAI Seminar第二十七期在深圳河套学院顺利举办。本次讲座特邀生成式人工智能领域的顶尖学者、俄罗斯高等经济大学人工智能模型理论基础实验室主任 Nikita Puchkin 教授，围绕“去噪扩散概率模型与基于分数的生成模型的数学基础”主题，系统分享了其团队在打破高维数据“维度灾难”、常微分方程采样机制以及高阶离散化推理加速等方面的最新理论突破与实践思考。

讲座简介

生成扩散模型已成为基于非平衡热力学的数据合成领域的重要范式，不仅推动我们向高质量图像生成迈出关键一步，更催生了流匹配（Flow Matching）、扩散薛定谔桥（Schrödinger Bridges）等前沿新兴方法。然而，模型为何能在极高维度下保持优异性能，以及如何突破其动辄成百上千步的缓慢推理瓶颈，始终是学术界与工业界共同面临的核心痛点。

本次报告系统阐述了去噪扩散概率模型与基于分数的生成模型的数学基础，重点剖析了“估计”与“推断”两个核心阶段。讲座展示了从底层概率论推导到工程推理加速、从随机微分方程（SDE）到确定性轨迹的全链路理论框架。

讲座内容

01 理论基石：得分估计与打破“维度灾难”

Puchkin教授首先从生成模型的核心任务切入，指出目标数据的真实分布极其复杂。传统方法（如基于核密度的估计方法）在面对高维数据（如28x28的图像，环境维度近800维）时，往往会陷入“维度灾难”而失效。

Puchkin教授指出，真实世界的数据虽然并非严格存在于低维流形上，但往往具备高度的内在结构性。其研究证明，通过合理设计神经网络架构进行得分匹配，可以有效地捕捉目标密度的结构特征。在这一框架下，模型收敛的速度主要取决于数据的“内在维度”（Intrinsic Dimension）而非庞大的“环境维度”（Ambient Dimension），从而在理论上严谨地解释了神经网络为何能在高维图像生成中取得巨大成功。

02 采样演进：从SDE到ODE的确定性生成轨迹

除了精准的得分估计，如何高质量地从模型中采样是另一大核心挑战。早期的扩散模型多依赖基于随机微分方程（SDE）的采样方案，这类方案为了保证轨迹模拟的准确性，必须采用极小的离散化步长，导致单张图片的生成需要进行海量的网络函数评估，计算成本极其高昂。

为此，Puchkin教授详细阐述了基于常微分方程（ODE）的采样范式（如DDIM）。基于Fokker-Planck方程的推导表明，通过移除SDE中的随机噪声项，ODE能够保持与原过程相同的边缘概率密度演化。更重要的是，ODE构建了一条从高斯噪声到目标数据更为平滑、甚至趋近于直线的确定性生成轨迹。这种“截弯取直”的几何特性，为大幅增加单步跨度、减少采样步数奠定了数学基础。

03 推理加速：高阶离散化与噪声调度优化

针对工业界高度关注的“推理加速”问题，Puchkin教授提出，采样器的离散化方案与噪声调度是决定推理效率的关键所在。

研究表明，由于误差随步长呈线性衰减，传统的欧拉一阶离散化方法收敛较慢，而引入二阶或更高阶的离散化方案，例如在每一步引入中间态评估，能使收敛率实现指数级跃升，进而达到平方级甚至更高阶的衰减。此外，合理选择噪声调度策略（如方差保持 vs. 方差爆炸），能够有效改善得分投影的轨迹曲率。通过结合高阶离散化与优化的噪声调度，模型能在极少步数内达到以往需要成百上千步才能实现的生成质量，极大地降低了计算开销。

问答环节，与会师生围绕“内在维度与环境维度的量级差异”、“高阶离散化带来的单步计算成本增加”等议题与Puchkin教授展开了深入讨论。

针对高阶方法计算量的权衡问题，Puchkin教授精辟地指出：虽然二阶方法在单步计算中需要执行两次函数评估，但由于其收敛速度的质变，总的迭代步数将大幅缩减。这种全局步数的指数级减少，彻底覆盖了单步计算的额外开销，是实现极致推理加速的核心所在。

讲座尾声，Puchkin教授指出，生成式建模领域正处于高速发展的黄金时期。从扩散模型出发，当前学术界正在向流匹配、薛定谔桥以及基于随机最优控制理论（Stochastic Optimal Control）的新型框架演进。本次讲座不仅是一次扩散模型前沿技术的系统梳理，更展示了一种“以严谨数学理论指导工程性能优化”的科研范式。Puchkin教授的工作充分体现了将复杂的生成域问题拆解为内在降维、轨迹平滑与离散优化的学术洞见，为构建更快、更好、更具理论保证的下一代生成式AI系统指明了方向。

【SLAI Seminar】第二十七期回顾｜扩散模型的前沿探索：从得分估计到高效采样

相关推荐

【SLAI Seminar】第二十八期回顾｜染色质折叠的物理建模与AI预测：从三维森林模型到虚拟细胞计算