平衡匹配:基于隐式能量模型的生成建模

发表
Niels RoggeNiels Rogge 提交
作者: Ray WangRunqian Wang, Yilun Du

摘要

AI 生成总结
平衡匹配 (EqM) 是一个生成模型框架,它学习隐式能量景观的平衡梯度,能够实现高效采样,并且性能优于传统的扩散模型和流模型。
我们提出了 Equilibrium Matching (EqM),一个基于平衡动力学观点的生成建模框架。EqM 放弃了传统扩散模型和流模型的非平衡、时间条件动力学,而是学习了一个隐式能量景观的平衡梯度。通过这种方法,我们可以在推理时采用基于优化的采样过程,其中样本通过在学习到的景观上进行梯度下降获得,具有可调的步长、自适应优化器和自适应计算。EqM 在生成性能上经验性地超越了扩散/流模型,在 ImageNet 256times256 上取得了 1.90 的 FID 分数。EqM 在理论上也证明了可以学习并从数据流形中采样。除了生成之外,EqM 是一个灵活的框架,可以自然地处理包括部分噪声图像去噪、OOD 检测和图像组合等任务。通过用统一的平衡景观取代时间条件速度,EqM 在流模型和基于能量的模型之间建立了更紧密的联系,并为基于优化的推理提供了一条简单的途径。
查看 arXiv 页面查看 PDF

评论