从权衡到协同:一个用于大型语言模型的通用共生水印框架

发表
Yidan WangYidan Wang 提交
作者: Yidan WangYidan Wang, Yubing Ren, Yanan Cao, Binxing Fang

摘要

大型语言模型 (LLM) 的兴起加剧了人们对人工智能生成文本滥用的担忧,使得水印成为一种有前途的解决方案。目前主流的 LLM 水印方案可分为两类:基于 logits 的方案和基于采样的方案。然而,现有方案在鲁棒性、文本质量和安全性之间存在权衡。为了缓解这个问题,我们整合了基于 logits 和基于采样的方案,利用它们各自的优势来实现协同效应。在本文中,我们提出了一种多功能共生水印框架,包含三种策略:串行、并行和混合。混合框架利用 token 熵和语义熵自适应地嵌入水印,从而优化了可检测性、鲁棒性、文本质量和安全性之间的平衡。此外,我们通过在各种数据集和模型上进行的全面实验验证了我们的方法。实验结果表明,我们的方法优于现有基线,并取得了最先进 (SOTA) 的性能。我们相信该框架为多样化的水印范式提供了新颖的见解。我们的代码可在 https://github.com/redwyd/SymMark{https://github.com/redwyd/SymMark} 获取。
查看 arXiv 页面查看 PDF

评论

Yidan WangYidan Wang
论文作者
论文提交者

大型语言模型 (LLM) 的兴起加剧了对 AI 生成文本滥用的担忧,使得水印技术成为一种有前景的解决方案。主流的 LLM 水印方案分为两类:基于 logits 的和基于采样的。然而,当前的方案需要在鲁棒性、文本质量和安全性之间进行权衡。为了缓解这个问题,我们结合了基于 logits 和基于采样的方案,利用它们各自的优势来实现协同作用。在本文中,我们提出了一种多功能的共生水印框架,包含三种策略:串行、并行和混合。混合框架利用 token 熵和语义熵自适应地嵌入水印,从而优化可检测性、鲁棒性、文本质量和安全性之间的平衡。此外,我们通过对各种数据集和模型进行全面实验来验证我们的方法。实验结果表明,我们的方法优于现有基线,并达到了最先进 (SOTA) 的性能。我们相信该框架为不同的水印范式提供了新的见解。我们的代码可在 https://github.com/redwyd/SymMark 获取。