Llama-3.1-FoundationAI-SecurityLLM-Base-8B 技术报告

发表
Aman PriyanshuAman Priyanshu 提交
作者: Paul KassianikPaul Kassianik, Baturay SaglamBaturay Saglam, Alexander Chen, Blaine Nelson, Anu VelloreAnu Vellore, Massimo AufieroMassimo Aufiero, Fraser BurchFraser Burch, Dhruv Kedia, Avi ZoharyAvi Zohary, Sajana Weerawardhena, Aman PriyanshuAman Priyanshu, Adam SwandaAdam Swanda, Amy Chang, Hyrum AndersonHyrum Anderson, Kojin Oshiba, Omar SantosOmar Santos, Yaron SingerYaron Singer, Amin Karbasi

摘要

随着基于 Transformer 的大型语言模型 (LLMs) 日益渗透社会,它们彻底改变了软件工程、创意写作和数字艺术等领域。然而,它们在网络安全领域的应用仍然有限,原因在于缺乏专门的训练数据以及表示网络安全特定知识的复杂性等挑战。为解决这些不足,我们提出了 Foundation-Sec-8B 模型,一个基于 Llama 3.1 架构、专注于网络安全的 LLM,并通过在精心策划的网络安全语料库上进行持续预训练得到增强。我们在现有和新的网络安全基准上评估了 Foundation-Sec-8B,结果显示,在某些特定的网络安全任务中,它与 Llama 3.1-70B 和 GPT-4o-mini 相当。通过向公众发布我们的模型,我们旨在加速 AI 驱动工具在公共和私人网络安全领域的进展和应用。
查看 arXiv 页面查看 PDF

评论

Aman PriyanshuAman Priyanshu
论文作者
论文提交者

本文介绍了 Foundation-Sec-8B,这是一个专注于网络安全的大型语言模型 (LLM),它基于 Llama 3.1 架构,并在专门的安全语料库上进行了持续预训练。评估表明,在安全领域的特定任务上,其性能可与更大的模型相媲美。该模型是一个公开发布的开源权重模型,旨在支持人工智能在网络安全领域内得到更广泛的应用 (https://huggingface.co/fdtn-ai/Foundation-Sec-8B)。