WebWeaver:通过动态大纲为开放式深度研究构建网络规模证据

发表
taesiritaesiri 提交
作者: Zijian LiZijian Li, Xin Guan, Bo Zhang, Shen Huang, Houquan Zhou, Shaopeng Lai, Ming Yan, Yong Jiang, pengjun xiePengjun Xie, Fei Huang, Jun Zhang, ZhouJingren Zhou

摘要

AI 生成总结
WebWeaver 是一个双智能体框架,它通过整合自适应规划和集中合成来解决开放式深度研究挑战,以生成高质量、可靠的报告。
本文解决了开放式深度研究(OEDR)这一复杂挑战,在这种挑战中,AI 代理必须将海量的网络规模信息综合成富有洞察力的报告。当前的方法存在双重限制:静态研究流程将规划与证据获取分离,以及一次性生成范例,这些范例很容易出现长上下文失败问题,如“中间丢失”和幻觉。为了应对这些挑战,我们引入了 WebWeaver,一种模仿人类研究过程的新型双代理框架。规划器在一个动态循环中运行,通过证据获取和大纲优化进行迭代交错,以生成与证据记忆库相关联的全面、基于来源的大纲。然后,编写器执行一个分层的检索和编写过程,逐节撰写报告。通过仅针对每个部分从记忆库中检索必要的证据,有效地缓解了长上下文问题。我们的框架在 DeepResearch Bench、DeepConsult 和 DeepResearchGym 等主要的 OEDR 基准测试中建立了新的最先进水平。这些结果验证了我们以人为中心的迭代方法,表明自适应规划和聚焦综合对于生成高质量、可靠且结构良好的报告至关重要。
查看 arXiv 页面查看 PDF

评论

taesiritaesiri
论文提交者

这篇论文解决了开放式深度研究(OEDR)这一复杂挑战,AI 代理需要将海量的网络信息综合成有见地的报告。当前的方法受制于双重限制:静态研究流程将规划与证据获取脱节,以及一次性生成模式容易出现长上下文失效问题,如“中间丢失”和幻觉。为了解决这些挑战,我们引入了 WebWeaver,一个新颖的双代理框架,它模拟了人类的研究过程。规划器在一个动态周期中运行,迭代地将证据获取与大纲优化相结合,以生成一个全面的、有来源依据的大纲,并链接到一个证据记忆库。然后,写手执行一个分层的检索和写作过程,分部分撰写报告。通过仅从记忆库中针对每个部分检索必要的证据,它有效地缓解了长上下文问题。我们的框架在 DeepResearch Bench、DeepConsult 和 DeepResearchGym 等主要的 OEDR 基准测试中建立了新的最先进水平。这些结果验证了我们以人为本的迭代方法,表明自适应规划和定向综合对于生成高质量、可靠且结构良好的报告至关重要。

Yury PanikovYury Panikov

谢谢