⏶5
大型语言模型版权保护:方法、挑战和趋势综述
发表
由
Zhebo Wang 提交

作者: Zhenhua Xu, Xubin Yue,
Zhebo Wang, Qichen Liu, Xixiang Zhao, Jingxuan Zhang, Wenjun Zeng, Wengpeng Xing, Dezhang Kong, Changting Lin, Meng Han

摘要
鉴于大型语言模型 (LLM) 巨大的开发成本、专有价值以及潜在的滥用风险,对其进行版权保护至关重要。现有调查主要关注 LLM 生成内容(即文本水印)的追溯技术,而对模型本身(即模型水印和模型指纹)的保护方法却缺乏系统性探索。此外,文本水印、模型水印和模型指纹之间的关系和区别也未得到全面阐明。本研究对 LLM 版权保护技术的现状进行了全面调查,重点关注模型指纹,涵盖以下方面:(1) 阐明从文本水印到模型水印和指纹的概念联系,并采用统一的术语,将模型水印纳入更广泛的指纹框架;(2) 概述和比较各种文本水印技术,突出其作为模型指纹的功能案例;(3) 系统地分类和比较 LLM 版权保护的现有模型指纹方法;(4) 首次提出指纹转移和指纹去除技术;(5) 总结模型指纹的评估指标,包括有效性、无害性、鲁棒性、隐蔽性和可靠性;(6) 讨论开放挑战和未来研究方向。本调查旨在为研究人员提供对 LLM 时代文本水印和模型指纹技术的全面理解,从而促进保护其知识产权的进一步发展。
github: https://xuzhenhua55.github.io/awesome-llm-copyright-protection/index.html