在前沿模型安全框架下评估亚马逊Nova Premier的关键风险

发表
SatyaSatya 提交
作者: Satyapriya Krishna, Ninareh Mehrabi, Abhinav Mohanty, Matteo Memelli, Vincent Ponzo, Payal Motwani, Rahul Gupta

摘要

Nova Premier 是亚马逊最强大的多模态基础模型,也是模型蒸馏的教师模型。它通过一百万个 token 的上下文窗口处理文本、图像和视频,使得在单个提示中分析大型代码库、400 页的文档和 90 分钟的视频成为可能。我们首次在《前沿模型安全框架》下对 Nova Premier 的关键风险概况进行了全面评估。评估针对三个高风险领域——化学、生物、放射和核 (CBRN)、进攻性网络操作以及自动化 AI 研发——并结合了自动化基准测试、专家红队测试和提升研究,以确定模型是否超过发布阈值。我们总结了我们的方法并报告了核心发现。基于此次评估,我们认为 Nova Premier 符合我们在 2025 年巴黎 AI 安全峰会上所做的承诺,可以安全地公开发布。随着与前沿模型相关的新风险和新能力的识别,我们将继续加强我们的安全评估和缓解流程。
查看 arXiv 页面查看 PDF

评论

SatyaSatya
论文提交者

亚马逊Nova Premier模型的前沿风险评估已公布。