⏶7
一个用于罕见病诊断的具有可追溯推理的智能体系统
发表
由
Weike Zhao 提交
作者:
Weike Zhao, Chaoyi Wu, Yanjie Fan, Xiaoman Zhang, Pengcheng Qiu, Yuze Sun, Xiao Zhou, Yanfeng Wang, Ya Zhang, Yongguo Yu, Kun Sun, Weidi Xie
摘要
全球有超过3亿人受罕见疾病影响,然而及时准确的诊断仍然是一个普遍存在的挑战。这主要归因于其临床异质性、个体发病率低以及大多数临床医生对罕见病症的熟悉度有限。在此,我们介绍DeepRare,这是第一个由大型语言模型(LLM)驱动的罕见疾病诊断智能体系统,能够处理异构临床输入。该系统为罕见疾病生成排序后的诊断假设,每个假设都附有一条透明的推理链,将中间分析步骤与可验证的医学证据相关联。
DeepRare包含三个关键组成部分:一个带有长期记忆模块的中央主机;以及负责领域特定分析任务的专用智能体服务器,这些服务器集成了40多种专业工具和网络规模的最新医学知识来源,确保访问最当前的临床信息。这种模块化和可扩展的设计使得复杂的诊断推理成为可能,同时保持了可追溯性和适应性。我们在八个数据集上评估了DeepRare。该系统在2,919种疾病中表现出卓越的诊断性能,对1013种疾病实现了100%的准确率。在基于HPO的评估中,DeepRare显著优于其他15种方法,如传统生物信息学诊断工具、LLM和其他智能体系统,实现了平均57.18%的Recall@1得分,并以23.79个百分点的显著优势超越了第二名(Reasoning LLM)。对于多模态输入场景,DeepRare在109个案例中实现了70.60%的Recall@1,而Exomiser为53.20%。临床专家对推理链的手动验证达到了95.40%的一致性。此外,DeepRare系统已作为用户友好的网络应用程序http://raredx.cn/doctor上线。

罕见病在全球范围内共同影响着超过3亿人,然而及时准确的诊断仍然是一个普遍的挑战。这主要是由于其临床异质性、个体发病率低以及大多数临床医生对罕见病症的熟悉程度有限。在此,我们介绍了DeepRare,首个由大型语言模型(LLM)驱动的罕见病诊断代理系统,能够处理异构临床输入。该系统为罕见病生成排名靠前的诊断假设,每个假设都附带一个透明的推理链,将中间分析步骤与可验证的医学证据联系起来。
DeepRare包含三个关键组件:一个带有长期记忆模块的中央主机;以及负责领域特定分析任务的专用代理服务器,这些服务器整合了40多个专业工具和网络规模的最新医学知识来源,确保获取最当前的临床信息。这种模块化和可扩展的设计使得复杂的诊断推理成为可能,同时保持了可追溯性和适应性。我们在八个数据集上评估了DeepRare。该系统在2,919种疾病中表现出卓越的诊断性能,对1013种疾病达到了100%的准确率。在基于HPO的评估中,DeepRare显著优于其他15种方法,如传统生物信息学诊断工具、LLM和其他代理系统,平均Recall@1得分达到57.18%,并以23.79个百分点的显著优势超越了次优方法(推理LLM)。对于多模态输入场景,DeepRare在109个病例中Recall@1达到了70.60%,而Exomiser为53.20%。临床专家对推理链的手动验证达到了95.40%的一致性。此外,DeepRare系统已作为用户友好的网络应用程序http://raredx.cn上线。