⏶32
AWorld:具有稳定操控能力的动态多智能体系统,用于稳健解决 GAIA 问题
发表
由
chenyi zhuang 提交
作者: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
摘要
大型语言模型(LLMs)的快速发展赋予了智能代理利用各种外部工具解决复杂现实世界问题的能力。然而,随着代理对多种工具的日益依赖,它们面临着新的挑战:来自不同来源的扩展上下文以及嘈杂或不相关的工具输出可能会损害系统可靠性和准确性。这些挑战强调了增强基于代理的系统稳定性的必要性。为了解决这个问题,我们引入了动态监督和操纵机制,在AWorld框架内构建了一个健壮而动态的多代理系统(MAS)架构。在我们的方法中,执行代理在关键步骤调用守卫代理以验证和纠正推理过程,从而有效减少由噪声引起的错误并增强问题解决的鲁棒性。对GAIA测试数据集的广泛实验表明,我们的动态操纵机制显著提高了解决方案的有效性和稳定性,优于单代理系统(SAS)和标准工具增强系统。因此,我们的动态MAS系统在著名的GAIA排行榜上的开源项目中位居第一。这些发现凸显了协作代理角色在开发更可靠和可信的智能系统方面的实际价值。
我们发布了一份技术报告,详细说明了我们的多智能体系统是如何构建的,以在 GAIA 测试排行榜上取得高绩效的。
Github:https://github.com/inclusionAI/AWorld