用富保真度解码器引导一步扩散模型用于快速图像压缩

发表
Zheng ChenZheng Chen 提交
作者: Zheng Chen, Mingde Zhou, Jinpei Guo, Jiale Yuan, Yifei Ji, Yulun Zhang

摘要

基于扩散的图像压缩模型在感知性能方面表现出色。然而,它存在两个关键缺陷:(1) 由于多步采样导致的解码延迟过高,以及 (2) 过度依赖生成先验导致的保真度不佳。为了解决这些问题,我们提出了 SODEC,一种新颖的单步扩散图像压缩模型。我们认为,在图像压缩中,足够丰富的信息潜藏使得多步细化变得不必要。基于这一见解,我们利用预训练的基于 VAE 的模型来生成信息丰富的潜藏,并用单步解码取代迭代去噪过程。同时,为了提高保真度,我们引入了保真度引导模块,鼓励输出忠实于原始图像。此外,我们设计了速率退火训练策略,以实现在极低比特率下的有效训练。大量的实验表明,SODEC 显著优于现有方法,实现了卓越的速率-失真-感知性能。此外,与以前基于扩散的压缩模型相比,SODEC 将解码速度提高了 20 倍以上。代码已发布于:https://github.com/zhengchen1999/SODEC
查看 arXiv 页面查看 PDF

评论

Zheng ChenZheng Chen
论文提交者

基于扩散的图像压缩已经展示了令人印象深刻的感知性能。然而,它面临两个关键缺点:(1) 由于多步采样导致的过度解码延迟,以及 (2) 过度依赖生成先验导致的保真度差。为了解决这些问题,我们提出了 SODEC,一种新颖的单步扩散图像压缩模型。我们认为在图像压缩中,一个足够信息丰富的潜在变量使得多步细化变得不必要。基于这一洞察,我们利用预训练的基于 VAE 的模型来生成信息丰富的潜在变量,并用单步解码取代迭代去噪过程。同时,为了提高保真度,我们引入了保真度引导模块,鼓励输出忠实于原始图像。此外,我们设计了码率退火训练策略,以实现在极低比特率下的有效训练。大量实验表明,SODEC 显著优于现有方法,实现了卓越的码率-失真-感知性能。此外,与以前的基于扩散的压缩模型相比,SODEC 将解码速度提高了 20 倍以上。