⏶11
鲁棒且细粒度的 AI 生成文本检测
发表
由
Ram Kadiyala 提交

作者:
Ram Mohan Rao Kadiyala,
Siddartha Pullakhandam, Kanwal Mehreen,
Drishti Sharma, Siddhant Gupta,
Jebish Purbey,
Ashay Srivastava,
Subhasya TippaReddy,
Arvind Reddy Bobbili, Suraj Telugara Chandrashekhar,
Modabbir Adeeb,
Srinadh Vura, Hamza Farooq




摘要
理想的机器生成内容检测系统应该能够在任何生成器上良好运行,因为每天都会出现更多先进的 LLM。现有系统通常难以准确识别较短文本的 AI 生成内容。此外,并非所有文本都完全由人类或 LLM 创作,因此我们更侧重于部分案例,即人机协作文本。我们的论文介绍了一组为 token 分类任务构建的模型,这些模型在大量人机协作文本上进行训练,这些模型在未见过的领域、未见过的生成器、非母语人士的文本以及带有对抗性输入的文本上表现良好。我们还介绍了一个新的数据集,其中包含超过 240 万条此类文本,这些文本主要由 23 种语言的几种流行的专有 LLM 共同创作。我们还展示了我们的模型在每个领域和生成器的每种文本上的性能结果。其他发现包括针对每种对抗方法的性能比较、输入文本的长度以及与原始人类创作文本相比的生成文本的特征。
在 token 级别检测 AI 生成的文本部分。