⏶6
超越流水线:关于模型原生智能体人工智能范式转变的调查
发表
由
sdzy 提交
作者: Jitao Sang, Jinlin Xiao, Jiarun Han, Jilin Chen, Xiaoyi Chen, Shuyu Wei, Yongjie Sun, Yuhang Wang
摘要
AI 生成总结
该调查概述了从基于流水线到模型原生具身AI的转变,强调了强化学习在整合规划、工具使用和语言模型记忆方面的作用,跨越各种领域。智能AI的快速发展标志着人工智能进入了一个新阶段,其中大型语言模型(LLMs)不再仅仅是响应,而是采取行动、进行推理和适应。本调查追踪了构建智能AI的范式转变:从管道系统(其中规划、工具使用和记忆由外部逻辑编排)到新兴的模型原生范式(其中这些能力内化在模型的参数中)。我们首先将强化学习(RL)定位为促成这种范式转变的算法引擎。通过将学习从模仿静态数据重新定义为结果驱动的探索,RL支持了语言、视觉和具身领域中LLM + RL + Task的统一解决方案。在此基础上,本调查系统地回顾了每种能力——规划、工具使用和记忆——如何从外部脚本模块演变为端到端学习行为。此外,它考察了这种范式转变如何重塑了主要的代理应用程序,特别是强调长距离推理的深度研究代理和强调具身交互的GUI代理。最后,我们讨论了多智能体协作和反思等智能能力的持续内化,以及系统和模型层在未来智能AI中不断演变的角色。总而言之,这些发展勾勒出了向模型原生智能AI的连贯轨迹,将其作为一个集成的学习和交互框架,标志着从构建应用智能的系统到开发通过经验增长智能的模型。
智能体式 AI 的快速发展标志着人工智能的一个新阶段,大型语言模型 (LLM) 不再仅仅响应,而是采取行动、进行推理和适应。本次调查追溯了构建智能体式 AI 的范式转变:从基于管道的系统(其中规划、工具使用和记忆由外部逻辑协调)到新兴的模型原生范式(其中这些能力内化在模型的参数中)。我们首先将强化学习 (RL) 定位为实现这一范式转变的算法引擎。通过将学习从模仿静态数据重构为以结果为导向的探索,RL 为语言、视觉和具身领域中的 LLM + RL + 任务统一解决方案奠定了基础。在此基础上,本次调查系统地回顾了规划、工具使用和记忆等各项能力如何从外部脚本模块演变为端到端学习的行为。此外,它还探讨了这一范式转变如何重塑主要的智能体应用,特别是强调长期推理的深度研究智能体和强调具身交互的 GUI 智能体。最后,我们讨论了多智能体协作和反思等智能体能力的持续内化,以及系统层和模型层在未来智能体式 AI 中不断演变的角色。总而言之,这些发展勾勒出了通往模型原生智能体式 AI 的连贯轨迹,作为一个集成的学习和交互框架,标志着从构建应用智能的系统到开发通过经验增长智能的模型。
