⏶23
解耦规划与执行:用于深度搜索的分层推理框架
发表
由
Jiajie Jin 提交
作者: Jiajie Jin, Xiaoxi Li, Guanting Dong, Yuyao Zhang, Yutao Zhu, Yang Zhao, Hongjin Qian, Zhicheng Dou
摘要
现实世界搜索场景中复杂的信息需求需要跨不同来源的深度推理和知识综合,而传统的检索增强生成 (RAG) 流水线难以有效地解决这些需求。当前基于推理的方法存在一个根本的局限性:它们使用单个模型来处理高层次规划和详细执行,导致推理效率低下和可扩展性有限。在本文中,我们介绍了一种分层框架 HiRA,该框架将战略规划与专业执行分开。我们的方法将复杂的搜索任务分解为重点明确的子任务,为每个子任务分配配备外部工具和推理能力的领域特定代理,并通过结构化的集成机制协调结果。这种分离防止了执行细节扰乱高层次推理,同时使系统能够利用专业知识来处理不同类型的信息。在四个复杂的跨模态深度搜索基准上的实验表明,HiRA 显著优于最先进的 RAG 和基于代理的系统。我们的结果表明,答案质量和系统效率都有所提高,突出了分离规划和执行对于多步骤信息搜寻任务的有效性。我们的代码可在 https://github.com/ignorejjj/HiRA 获取。
介绍
我们提出了 HiRA,一个分层推理框架,它将高级计划与执行分开,从而实现更高效和可扩展的深度搜索任务。通过集成专门的专家代理,HiRA 提高了答案质量和系统效率,在多个基准测试中优于传统方法和当前的基于代理的系统。通过我们的方法探索动态的、工具增强推理的全部潜力。
🎯 关键点:HiRA 没有强迫一个模型处理所有事情,而是使用由元计划器协调的专门专家代理——可以将其视为由战略指挥官指挥领域专家!结果如何?更短的推理链、更少的环境交互以及在复杂的多模式搜索任务中卓越的性能。
⚡ 即插即用架构 - 现有的搜索代理可以直接集成,无需重新训练!通过具有双通道内存的创新自适应推理协调器,与搜索、代码执行和多模式功能无缝协作。
框架
Github Repo: https://github.com/ignorejjj/HiRA