⏶2
小型语言模型是代理 AI 的未来
发表
由
Peter Belcak 提交
作者: Peter Belcak, Greg Heinrich, Shizhe Diao, Yonggan Fu, Xin Dong, Saurav Muralidharan, Yingyan Celine Lin, Pavlo Molchanov
摘要
大型语言模型(LLM)常因其在广泛任务上表现出接近人类的性能而受到赞扬,并因其进行通用对话的能力而受到重视。然而,智能体AI系统的兴起正在带来大量的应用,其中语言模型以很少的变化重复执行少量专业任务。
我们认为,对于智能体系统中的许多调用,小型语言模型(SLM)足够强大,本质上更适合,并且必然更经济,因此是智能体AI的未来。我们的论证基于SLM目前展示的能力水平、智能体系统的常见架构以及LM部署的经济性。我们进一步认为,在通用对话能力至关重要的情境下,异构智能体系统(即调用多个不同模型的智能体)是自然的选择。我们讨论了SLM在智能体系统中采用的潜在障碍,并概述了一种通用的LLM到SLM智能体转换算法。
我们的立场,以价值声明的形式提出,强调了即使是LLM到SLM的部分转变也将对AI智能体行业产生的运营和经济影响的重要性。我们旨在激发关于有效利用AI资源的讨论,并希望推动降低当前AI成本的努力。我们呼吁对我们的立场进行贡献和批评,并承诺在 https://research.nvidia.com/labs/lpr/slm-agents 上发布所有此类通信。
对智能体 AI 不断变化格局的评估。