⏶2
GraphTracer:用于鲁棒性多轮深度搜索的 LLM 智能体的图引导故障追踪
发表
由
Yuling 提交

作者: Heng Zhang,
Yuling Shi, Xiaodong Gu, Haochen You, Zijian Zhang, Lubin Gan, Yilei Yuan, Jin Huang

摘要
AI 生成总结
GraphTracer 通过构建信息依赖图来跟踪信息流并提高调试准确性,从而解决多智能体系统故障的归因问题。由大型语言模型驱动的多智能体系统通过协同协作在复杂任务中表现出色,但在多轮深度搜索场景中却面临高失败率。现有的时间归因方法难以准确诊断根本原因,尤其是在错误跨越多个代理传播时。分析动作序列以自动化失败归因的尝试由于无法考虑跨代理的信息依赖性而无效。本文确定了两个核心挑战:(i) 在多智能体错误传播中区分症状和根本原因,以及 (ii) 追踪超越时间顺序的信息依赖性。为了解决这些问题,我们引入了 GraphTracer,一个通过信息流分析重新定义失败归因的框架。GraphTracer 构建信息依赖图 (IDG) 以明确捕获代理如何引用和构建先前的输出。它通过沿着这些依赖结构进行追踪来定位根本原因,而不是依赖于时间序列。GraphTracer 还使用图感知合成数据生成来定位关键节点,创建真实的故障场景。在 Who&When 基准测试上的评估以及在生产系统中的集成表明,GraphTracer-8B 比最先进的模型取得了高达 18.18% 的更高归因准确率,并在部署的多智能体框架中实现了 4.8% 到 14.2% 的性能改进,为多智能体系统的调试建立了一个强大的解决方案。
查看这项最新工作!