⏶28
HierSearch:一个集成本地和网络搜索的分层企业深度搜索框架
发表
由
Jiejun Tan 提交

作者:
Jiejun Tan, Zhicheng Dou, Yan Yu, Jiehan Cheng, Qiang Ju, Jian Xie, Ji-Rong Wen

摘要
最近,大型推理模型展现出强大的数学和编码能力,而深度搜索利用它们的推理能力来完成具有挑战性的信息检索任务。现有的深度搜索工作通常局限于单一知识源,无论是本地还是网络。然而,企业通常需要可以利用本地和网络语料库的搜索工具的私人深度搜索系统。简单地训练一个配备多个搜索工具的代理,使用扁平强化学习(RL)是一个直接的想法,但它存在训练数据效率低和复杂工具掌握能力差等问题。为了解决上述问题,我们提出了一种分层代理深度搜索框架 HierSearch,使用分层 RL 进行训练。在低层,训练一个本地深度搜索代理和一个网络深度搜索代理,从各自的领域检索证据。在高层,一个规划代理协调低层代理并提供最终答案。此外,为了防止直接答案复制和错误传播,我们设计了一个知识提炼器,可以过滤掉低层代理返回的幻觉和不相关证据。实验表明,HierSearch 比扁平 RL 取得了更好的性能,并在跨通用、金融和医疗领域的六个基准测试中优于各种深度搜索和多源检索增强生成基线。
HierSearch,一个使用分层强化学习的分层智能体深度搜索框架,通过协调本地和Web搜索智能体并提炼知识,提高了多源检索任务的性能。
代码和数据集可在 https://github.com/plageon/HierSearch 获取。
🌹 如果您觉得这项工作有帮助,请✨为我们的 GitHub 仓库 加星或点赞这篇论文以支持我们。您的加星对我们意义重大!