⏶103
WebWeaver:通过动态大纲为开放式深度研究构建网络规模证据
发表
由
taesiri 提交

作者:
Zijian Li, Xin Guan, Bo Zhang, Shen Huang, Houquan Zhou, Shaopeng Lai, Ming Yan, Yong Jiang,
Pengjun Xie, Fei Huang, Jun Zhang,
Jingren Zhou
摘要
AI 生成总结
WebWeaver 是一个双智能体框架,它通过整合自适应规划和集中合成来解决开放式深度研究挑战,以生成高质量、可靠的报告。本文解决了开放式深度研究(OEDR)这一复杂挑战,在这种挑战中,AI 代理必须将海量的网络规模信息综合成富有洞察力的报告。当前的方法存在双重限制:静态研究流程将规划与证据获取分离,以及一次性生成范例,这些范例很容易出现长上下文失败问题,如“中间丢失”和幻觉。为了应对这些挑战,我们引入了 WebWeaver,一种模仿人类研究过程的新型双代理框架。规划器在一个动态循环中运行,通过证据获取和大纲优化进行迭代交错,以生成与证据记忆库相关联的全面、基于来源的大纲。然后,编写器执行一个分层的检索和编写过程,逐节撰写报告。通过仅针对每个部分从记忆库中检索必要的证据,有效地缓解了长上下文问题。我们的框架在 DeepResearch Bench、DeepConsult 和 DeepResearchGym 等主要的 OEDR 基准测试中建立了新的最先进水平。这些结果验证了我们以人为中心的迭代方法,表明自适应规划和聚焦综合对于生成高质量、可靠且结构良好的报告至关重要。
评论
Github: https://github.com/Alibaba-NLP/DeepResearch/
博客: https://tongyi-agent.github.io/blog/
arXiv 解释了这篇论文的详细内容 👉 https://arxivexplained.com/papers/webweaver-structuring-web-scale-evidence-with-dynamic-outlines-for-open-ended-deep-research
这篇论文解决了开放式深度研究(OEDR)这一复杂挑战,AI 代理需要将海量的网络信息综合成有见地的报告。当前的方法受制于双重限制:静态研究流程将规划与证据获取脱节,以及一次性生成模式容易出现长上下文失效问题,如“中间丢失”和幻觉。为了解决这些挑战,我们引入了 WebWeaver,一个新颖的双代理框架,它模拟了人类的研究过程。规划器在一个动态周期中运行,迭代地将证据获取与大纲优化相结合,以生成一个全面的、有来源依据的大纲,并链接到一个证据记忆库。然后,写手执行一个分层的检索和写作过程,分部分撰写报告。通过仅从记忆库中针对每个部分检索必要的证据,它有效地缓解了长上下文问题。我们的框架在 DeepResearch Bench、DeepConsult 和 DeepResearchGym 等主要的 OEDR 基准测试中建立了新的最先进水平。这些结果验证了我们以人为本的迭代方法,表明自适应规划和定向综合对于生成高质量、可靠且结构良好的报告至关重要。