⏶8
Cyber-Zero:无需运行时训练网络安全智能体
发表
由
Terry Yue Zhuo 提交

作者:
Terry Yue Zhuo, Dingmin Wang, Hantian Ding, Varun Kumar,
Zijian Wang

摘要
大型语言模型(LLM)在经过可执行运行时环境的训练后,在软件工程任务中取得了显著成功,尤其是在解决GitHub问题方面。然而,此类运行时环境在其他领域通常不可用,特别是在网络安全领域,挑战配置和执行上下文是瞬态或受限的。我们提出了Cyber-Zero,这是第一个无需运行时的框架,用于合成高质量的代理轨迹,以训练网络安全LLM。Cyber-Zero利用公开可用的CTF攻略,并采用以角色驱动的LLM模拟来逆向工程运行时行为并生成逼真、长时程的交互序列,而无需实际环境。通过使用Cyber-Zero合成的轨迹,我们训练了基于LLM的代理,在InterCode-CTF、NYU CTF Bench和Cybench这三个著名的CTF基准测试中,比基线模型实现了高达13.1%的绝对性能提升。我们最好的模型Cyber-Zero-32B在开源模型中建立了新的最先进性能,与DeepSeek-V3-0324和Claude-3.5-Sonnet等专有系统的能力相匹配,同时提供了卓越的成本效益,并证明了无需运行时的轨迹合成可以有效地普及最先进网络安全代理的开发。
公开链接:https://github.com/amazon-science/Cyber-Zero
修补后的基准测试即将发布 :)