DoctorAgent-RL:一个用于多轮临床对话的多智能体协作强化学习系统

发表
Jiawei WangJiawei Wang 提交
作者: fengyichunYichun Feng, Jiawei WangJiawei Wang, Lu Zhou, liyixueYixue Li

摘要

大型语言模型(LLM)在生物医学问答领域展现出卓越能力,但其在真实世界临床咨询中的应用仍面临核心挑战。现有系统依赖于单向信息传输模式,患者必须在一轮中完整描述其症状,当病情描述模糊时会导致非特异性诊断建议。传统的基于监督学习的多轮对话方法受限于静态数据驱动范式,缺乏泛化能力,并且难以智能地提取关键临床信息。为了解决这些限制,我们提出了DoctorAgent-RL,这是一个基于强化学习(RL)的多智能体协作框架,它将医疗咨询建模为不确定性下的动态决策过程。医生智能体通过与患者智能体进行多轮交互,在RL框架内不断优化其提问策略,并根据咨询评估器提供的综合奖励动态调整其信息收集路径。这种RL微调机制使得LLM能够自主开发符合临床推理逻辑的交互策略,而不是肤浅地模仿现有对话数据中的模式。值得注意的是,我们构建了MTMedDialog,这是第一个能够模拟患者交互的英语多轮医疗咨询数据集。实验表明,DoctorAgent-RL在多轮推理能力和最终诊断性能方面均优于现有模型,证明了其在辅助临床咨询方面的实际价值。https://github.com/JarvisUSTC/DoctorAgent-RL
查看 arXiv 页面查看 PDF

评论

Jiawei WangJiawei Wang
论文作者
论文提交者

image.png