Flash-Searcher:通过基于 DAG 的并行执行实现快速有效的网络代理

发表
tianruitianrui 提交
作者: Tianrui Qin, Qianben Chen, Sinuo Wang, He Xing, King Zhu, He Zhu, Dingfeng Shi, Xinxin Liu, Ge Zhang, Jiaheng Liu, Yuchen Eleanor Jiang, Xitong Gao, Wangchunshu Zhou

摘要

AI 生成总结
Flash-Searcher 是一种使用定向无环图的并行智能体推理框架,通过实现并发执行和动态工作流优化,提高了复杂推理任务的效率和性能。
大型语言模型 (LLM) 在配备外部工具时,在复杂的推理任务中展现出了卓越的能力。然而,当前的框架主要依赖于顺序处理,这导致执行效率低下,尤其是在需要大量工具交互的任务中。本文介绍了 Flash-Searcher,一个新颖的并行代理推理框架,它将执行范式从顺序链根本性地重新构想为有向无环图 (DAG)。Flash-Searcher 将复杂任务分解为具有明确依赖关系的子任务,从而实现独立推理路径的并发执行,同时保持逻辑约束。通过动态工作流优化,我们的框架根据中间结果不断优化执行图,有效地集成了摘要模块。在多个基准上的全面评估表明,Flash-Searcher 的性能始终优于现有方法。具体来说,它在 BrowseComp 上实现了 67.7% 的准确率,在 xbench-DeepSearch 上实现了 83% 的准确率,同时与当前框架相比,代理执行步骤减少了高达 35%。此外,当我们通过蒸馏将此并行推理管道集成到单个模型中时,我们在各种骨干架构上观察到显著的性能提升,这强调了我们方法的可推广性。因此,我们的工作代表了代理架构设计的一个重大进步,为复杂的推理任务提供了一个更具可扩展性和效率的范式。
查看 arXiv 页面查看 PDF

评论

tianruitianrui
论文提交者

Flash-Searcher 是一个新颖的并行 Agent 推理框架,它使用 DAG 来实现并发、依赖感知任务执行,显著提高了准确性和效率,优于顺序方法。