⏶3
自回归图像生成水印
发表
由
Niels Rogge 提交

作者: Nikola Jovanović, Ismail Labiad, Tomáš Souček, Martin Vechev, Pierre Fernandez
摘要
对生成模型输出进行水印已成为追踪其来源的一种有前景的方法。尽管自回归图像生成模型及其滥用潜力受到了广泛关注,但以前没有任何工作尝试在词元级别对其输出进行水印。在这项工作中,我们通过将语言模型水印技术应用于此设置,提出了第一个此类方法。我们识别出一个关键挑战:缺乏逆循环一致性(RCC),即重新词元化生成的图像词元会显著改变词元序列,从而有效地擦除水印。为了解决这个问题并使我们的方法对常见的图像变换、神经压缩和去除攻击具有鲁棒性,我们引入了(i)一种自定义的词元化器-反词元化器微调过程,以改善RCC,以及(ii)一个互补的水印同步层。正如我们的实验所证明的,我们的方法能够实现可靠且鲁棒的水印检测,并具有理论基础的p值。
代码:https://github.com/facebookresearch/wmar