通过词法偏置的自回归图像水印:一种抵抗再生成攻击的方法

发表
Yiren SongYiren Song 提交
作者: Siqi Hui, Yiren Song, Sanping Zhou, Ye Deng, Wenli Huang, Jinjun Wang

摘要

自回归 (AR) 图像生成模型因其在合成质量方面的突破而受到越来越多的关注,凸显了对鲁棒水印以防止滥用的需求。然而,现有的生成内水印技术主要针对扩散模型设计,其中水印嵌入在扩散潜在状态中。这种设计给直接适应 AR 模型带来了巨大挑战,因为 AR 模型通过令牌预测按顺序生成图像。此外,基于扩散的再生攻击可以通过扰动扩散潜在状态有效擦除此类水印。为了解决这些挑战,我们提出了词法偏差水印 (LBW),这是一种专为 AR 模型设计的新型框架,可抵抗再生攻击。LBW 通过在生成过程中将令牌选择偏向预定义的白名单,直接将水印嵌入到令牌图中。这种方法确保了与现有 AR 模型的无缝集成,并自然地扩展到事后水印。为了提高抵抗白盒攻击的安全性,LBW 不使用单个白名单,而是为每张图像从白名单池中随机采样白名单。水印检测通过量化和令牌分布的统计分析进行。广泛的实验表明,LBW 实现了卓越的水印鲁棒性,尤其是在抵抗再生攻击方面。
查看 arXiv 页面查看 PDF

评论

Yiren SongYiren Song
论文提交者

自回归 (AR) 图像生成模型因其在合成质量方面的突破而受到越来越多的关注,这凸显了强大水印以防止滥用的必要性。然而,现有的生成内水印技术主要为扩散模型设计,其中水印嵌入在扩散潜在状态中。这种设计对直接适应 AR 模型提出了重大挑战,因为 AR 模型通过令牌预测顺序生成图像。此外,基于扩散的再生成攻击可以通过扰动扩散潜在状态有效地擦除此类水印。

为了解决这些挑战,我们提出了词汇偏置水印 (LBW),这是一种专为 AR 模型设计的新颖框架,可抵抗再生成攻击。LBW 通过在生成过程中将令牌选择偏置到预定义“绿色列表”来直接将水印嵌入到令牌图中。这种方法确保了与现有 AR 模型的无缝集成,并自然地扩展到事后水印。

为了提高对抗白盒攻击的安全性,LBW 不使用单个绿色列表,而是从绿色列表池中随机采样每个图像的绿色列表。水印检测通过量化和令牌分布的统计分析进行。广泛的实验表明,LBW 实现了卓越的水印鲁棒性,尤其是在抵抗再生成攻击方面。