离散马尔可夫桥

发表
LiLi 提交
作者: LiHengli Li, Yuxuan WangYuxuan Wang, Song-Chun Zhu, Ying Nian Wu, Zilong ZhengZilong Zheng

摘要

离散扩散最近成为离散数据建模中一个有前景的范式。然而,现有方法通常在训练过程中依赖固定的速率转移矩阵,这不仅限制了变分方法的根本优势——潜在表示的表达能力,还限制了整体设计空间。为了解决这些限制,我们提出了离散马尔可夫桥(Discrete Markov Bridge),这是一个专门为离散表示学习设计的新颖框架。我们的方法基于两个关键组件:矩阵学习(Matrix Learning)和得分学习(Score Learning)。我们进行了严格的理论分析,为矩阵学习建立了正式的性能保证,并证明了整体框架的收敛性。此外,我们分析了我们方法的空间复杂度,解决了先前研究中发现的实际约束。广泛的实证评估验证了所提出的离散马尔可夫桥的有效性,该方法在Text8数据集上达到了1.38的证据下界(ELBO),优于已有的基线。此外,所提出的模型在CIFAR-10数据集上表现出有竞争力的性能,取得了与特定图像生成方法相当的结果。
查看 arXiv 页面查看 PDF

评论