⏶3
LiveSecBench:一个面向中文语境下大语言模型的动态且文化相关的 AI 安全基准
发表
由
taesiri 提交
作者: Yudong Li, Zhongliang Yang, Kejiang Chen, Wenxuan Wang, Tianxin Zhang, Sifang Wan,
Kecheng Wang, Haitian Li, Xu Wang, Lefan Cheng, Youdan Yang, Baocheng Chen, Ziyu Liu, Yufei Sun, Liyan Wu, Wenya Wen, Xingchi Gu, Peiru Yang
摘要
AI 生成总结
LiveSecBench 是一个持续更新的中文 LLM 安全基准,从合法性、伦理、事实性、隐私、对抗鲁棒性和推理安全性六个关键维度对其进行评估。在这项工作中,我们提出了 LiveSecBench,一个专门针对中文 LLM 应用场景的动态持续更新的安全基准。LiveSecBench 根据中国的法律和社会框架,在六个关键维度(合法性、伦理、真实性、隐私、对抗鲁棒性和推理安全性)评估模型。该基准通过动态更新计划保持相关性,该计划将纳入新的威胁向量,例如计划在下次更新中包含文本到图像生成安全和代理安全。目前,LiveSecBench (v251030) 已评估了 18 个 LLM,提供了中文语境下 AI 安全的概况。排行榜可在 https://livesecbench.intokentech.cn/ 公开访问。
在此项工作中,我们提出了 LiveSecBench,一个专为中文LLM应用场景设计的动态且持续更新的安全基准。LiveSecBench 根据中国法律和社会框架,在六个关键维度(合法性、伦理、事实性、隐私、对抗鲁棒性和推理安全性)评估模型。该基准通过动态更新计划保持相关性,该计划纳入了新的威胁向量,例如计划在下次更新中包含文本到图像生成安全性和代理安全性。目前,LiveSecBench (v251030) 已评估了 18 个LLM,提供了中文语境下人工智能安全的全景。