⏶17
离散马尔可夫桥
发表
由
Li 提交
作者:
Hengli Li,
Yuxuan Wang, Song-Chun Zhu, Ying Nian Wu,
Zilong Zheng
摘要
离散扩散最近成为离散数据建模中一个有前景的范式。然而,现有方法通常在训练过程中依赖固定的速率转移矩阵,这不仅限制了变分方法的根本优势——潜在表示的表达能力,还限制了整体设计空间。为了解决这些限制,我们提出了离散马尔可夫桥(Discrete Markov Bridge),这是一个专门为离散表示学习设计的新颖框架。我们的方法基于两个关键组件:矩阵学习(Matrix Learning)和得分学习(Score Learning)。我们进行了严格的理论分析,为矩阵学习建立了正式的性能保证,并证明了整体框架的收敛性。此外,我们分析了我们方法的空间复杂度,解决了先前研究中发现的实际约束。广泛的实证评估验证了所提出的离散马尔可夫桥的有效性,该方法在Text8数据集上达到了1.38的证据下界(ELBO),优于已有的基线。此外,所提出的模型在CIFAR-10数据集上表现出有竞争力的性能,取得了与特定图像生成方法相当的结果。
链接:
arxiv: https://arxiv.org/pdf/2505.19752
github: https://github.com/Henry839/Discrete-Markov-Bridge/tree/main
twitter: https://x.com/Hengli_Li_pku/status/1927198832019874270