⏶8
Uni-Instruct:通过统一扩散散度指令实现的一步式扩散模型
发表
由
Yifei Wang 提交

作者:
Yifei Wang, Weimin Bai, Colin Zhang, Debing Zhang, Weijian Luo, He Sun

摘要
在本文中,我们将超过 10 种现有的一步扩散蒸馏方法(例如 Diff-Instruct、DMD、SIM、SiD、f-distill 等)统一到我们称之为 \emph{Uni-Instruct} 的理论驱动框架中。Uni-Instruct 的灵感来源于我们提出的 f 散度族扩散展开理论。然后,我们介绍了克服原始展开 f 散度棘手问题的关键理论,从而产生一个等效但易于处理的损失,通过最小化展开的 f 散度族有效地训练一步扩散模型。Uni-Instruct 引入的新颖统一不仅提供了有助于从高层次理解现有方法的新理论贡献,还带来了最先进的一步扩散生成性能。在 CIFAR10 生成基准上,Uni-Instruct 在无条件生成方面实现了创纪录的 Frechet Inception Distance (FID) 值 \emph{1.46},在条件生成方面实现了 \emph{1.38}。在 ImageNet-64\times 64 生成基准上,Uni-Instruct 达到了一步生成新的 SoTA FID \emph{1.02},其性能优于其 79 步教师扩散模型,有显着改进幅度 1.33 (1.02 vs 2.35)。我们还将 Uni-Instruct 应用于更广泛的任务,如文本到 3D 生成。对于文本到 3D 生成,Uni-Instruct 取得了不错的结果,在生成质量和多样性方面略优于先前的 SDS 和 VSD 等方法。Uni-Instruct 在理论和实证方面的坚实贡献有望帮助未来关于一步扩散蒸馏和扩散模型知识迁移的研究。

我们提出了 Uni-Instruct,它统一了 10 多种现有的一步扩散蒸馏方法,并在新的 ImageNet64x64 基准上实现了 SoTA 的一步生成结果,FID 为 1.02。在 Uni-Instruct 中,我们从分数匹配和最大对数似然之间的联系中汲取灵感。我们提出了一个新的扩散展开定理,将 f-散度展开为积分分数散度的形式,这统一了先前的蒸馏方法,如 DI(积分 KL 散度)和 SIM(积分分数散度)。代码和模型权重将很快发布。