MedReseacher-R1:通过知识知悉的轨迹合成框架实现专家级医学深度研究

发表
Adina YakefuAdina Yakefu 提交
作者: ErinyuAiling Yu, Lan Yao, Jingnan Liu, Zhe Chen, Jiajun Yin, Yuan Wang, Xinhao Liao, Ye ZhilingZhiling Ye, Ji Li, Yun Yue, Hansong Xiao, Hualei Zhou, Chunxiao Guo, Peng Wei, Jinjie GuJinjie Gu

摘要

AI 生成总结
一个使用医学知识图谱和自定义检索引擎的医疗深度研究智能体,在医疗基准测试中取得了最先进的性能,同时在一般研究任务中保持了竞争力。
大型语言模型(LLM)为基础的代理的最新发展在多个领域展现了令人印象深刻的能力,例如在复杂的信息检索和综合任务上表现优越的深度研究系统。虽然通用深度研究代理展现了令人印象深刻的能力,但它们在医学领域的挑战方面却面临显著困难,领先的专有系统在复杂的医学基准测试上获得的准确性有限就证明了这一点。关键限制是:(1)模型缺乏足够的密集医学知识来进行临床推理,以及(2)框架受到缺乏针对医学环境定制的专用检索工具的限制。我们提出了一个解决这些挑战的医学深度研究代理,它通过两项核心创新实现。首先,我们开发了一个利用医学知识图的新型数据合成框架,从围绕罕见医学实体的子图提取最长的链,以生成复杂的多跳问答对。其次,我们将一个定制构建的私人医学检索引擎与通用工具集成,从而能够进行准确的医学信息合成。我们的方法生成了跨越12个医学专业的2100多个多样化的轨迹,平均每次交互涉及4.2个工具。通过结合监督微调和带有复合奖励的在线强化学习的两阶段训练范式,我们的MedResearcher-R1-32B模型展现了卓越的性能,在医学基准测试上取得了新的最先进成果,同时在通用深度研究任务上保持了有竞争力的性能。我们的工作表明,在架构、工具设计和训练数据构建方面进行战略性的领域特定创新,可以使规模较小的开源模型在特定领域超越规模大得多的专有系统。
查看 arXiv 页面查看 PDF

评论

Adina YakefuAdina Yakefu
论文提交者

MedResearcher-R1是由蚂蚁集团发布的一款医学领域的DeepResearch Agent模型。