InfoAgent:推进自主信息搜集智能体

发表
Miaosen ZhangMiaosen Zhang 提交
作者: Gongrui Zhang, Jialiang Zhu, Ruiqi Yang, Kai Qiu, Miaosen ZhangMiaosen Zhang, Zhirong Wu, Qi Dai, Bei Liu, Chong Luo, Zhengyuan YangZhengyuan Yang, Linjie Li, Lijuan Wang, Weizhu Chen, Yuan Zhang, Xin Li, Zhaoyi Liu, Xin Geng, Baining Guo

摘要

AI 生成总结
InfoAgent 是一个使用自定义数据合成管道和搜索基础设施的深度研究智能体,通过改进工具使用和推理,优于现有智能体。
构建通过与外部工具交互来扩展能力的大型语言模型代理代表着人工智能研究和应用的新前沿。在本文中,我们介绍了 InfoAgent,一个由创新的数据合成管道和编排的网络搜索工具驱动的深度研究代理。为了构建具有挑战性、难以查找的查询,我们构建了实体树并应用子树采样和实体模糊化来系统地增加问题难度。与 prior 工作严重依赖商业搜索工具不同,我们开发了一个专用的自托管搜索基础设施,增强了代理环境的透明度并促进了代理能力的进一步发展。我们通过衡量正确回答问题所需的平均工具调用次数来评估我们数据管道的有效性,并表明我们的代理在配备我们的工具时能获得更好的性能。我们的 InfoAgent 是从 Qwen3-14B 经过两阶段配方进行事后训练的:冷启动监督微调以灌输长视野搜索行为,然后是强化学习,这显著提高了驱动推理的工具使用。通过我们的方法,InfoAgent 在 BrowseComp 上取得了 15.3% 的准确率,在 BrowseComp-ZH 上取得了 29.2% 的准确率,在 Xbench-DS 上取得了 40.4% 的准确率,优于 prior 的开源深度研究代理,如 WebSailor-72B 和 DeepDive-32B。
查看 arXiv 页面查看 PDF

评论

Miaosen ZhangMiaosen Zhang
论文作者
论文提交者

一种新的 DeepResearch Agent 模型。