Peccavi:一种用于AI生成图像的抗视觉复述攻击且无失真的图像水印技术

发表
Aman ChadhaAman Chadha 提交
作者: Shreyas Dixit, Ashhar Aziz, Shashwat Bajpai, Vasu Sharma, Aman ChadhaAman Chadha, Vinija Jain, Amitava Das

摘要

欧盟执法机构的一份报告预测,到2026年,高达90%的在线内容可能是合成生成的,这引起了政策制定者的担忧,他们警告称:“生成式AI可能会成为政治虚假信息的倍增器。生成式文本、图像、视频和音频的综合影响可能会超越任何单一模态的影响。”作为回应,加利福尼亚州的AB 3211法案强制要求对AI生成的图像、视频和音频进行水印处理。然而,隐形水印技术易受篡改的脆弱性以及恶意行为者完全绕过它们的可能性仍然令人担忧。由生成式AI驱动的去水印攻击,特别是新引入的视觉意译攻击,已显示出完全去除水印的能力,从而导致原始图像的意译。本文介绍了PECCAVI,这是首个视觉意译攻击安全且无失真的图像水印技术。在视觉意译攻击中,图像在保留其核心语义区域(称为非熔点,NMPs)的同时被修改。PECCAVI策略性地将水印嵌入到这些NMPs中,并采用多通道频域水印。它还结合了噪声抛光,以对抗旨在定位NMPs以破坏嵌入水印的逆向工程努力,从而增强了耐久性。PECCAVI是模型无关的。所有相关资源和代码都将开源。
查看 arXiv 页面查看 PDF

评论

Aman ChadhaAman Chadha
论文作者
论文提交者

PECCAVI 引入了首个能够抵抗视觉意译攻击同时保持图像保真度的水印技术。

- 新颖的水印策略: PECCAVI 将水印嵌入到非熔点(NMPs)——即不受视觉意译影响的稳定语义区域。

- 多层防御: 结合多通道频域嵌入、对抗性噪声(噪声抛光)和随机修补以增强鲁棒性。

- 高保真和弹性: 与 ZoDiac 和 WAM 等最先进方法相比,展现出卓越的水印可检测性和最小的图像失真。