ReasonIR: 训练用于推理任务的检索器

发表
AKAK 提交
作者: Rulin ShaoRulin Shao, Rui QiaoRui Qiao, Varsha Kishore, Niklas MuennighoffNiklas Muennighoff, Xi Victoria Lin, Daniela Rus, Bryan Kian Hsiang Low, Sewon MinSewon Min, Wen-tau Yih, Pang Wei KohPang Wei Koh, Luke Zettlemoyer

摘要

我们提出了 ReasonIR-8B,这是首个专门为通用推理任务训练的检索器。现有检索器在推理任务上表现有限,部分原因在于现有训练数据集侧重于与文档直接关联的简短事实性查询。我们开发了一个合成数据生成流程,该流程能为每个文档创建一个具有挑战性且相关的查询,以及一个看似相关但最终无用的困难负样本。通过结合我们的合成数据和现有公共数据进行训练,ReasonIR-8B 在 BRIGHT(一个广泛使用的推理密集型信息检索 (IR) 基准测试)上取得了新的最优性能:不使用重排序器时 nDCG@10 为 29.9,使用重排序器时 nDCG@10 为 36.9。将 ReasonIR-8B 应用于 RAG 任务时,相对于闭卷基线,它分别将 MMLU 和 GPQA 的性能提高了 6.4% 和 22.6%,优于其他检索器和搜索引擎。此外,ReasonIR-8B 更有效地利用测试时计算资源:在 BRIGHT 上,其性能随着更长、信息更丰富的重写查询而持续提升;当与 LLM 重排序器结合使用时,它继续优于其他检索器。我们的训练方法具有通用性,可以轻松扩展到未来的 LLM;为此,我们开源了代码、数据和模型。
查看 arXiv 页面查看 PDF

评论

AKAK
论文提交者

Screenshot 2025-04-29 at 10.27.57 PM.png