DrugReasoner:具有推理增强语言模型的药物批准可解释预测

发表
Ali MotahharyniaAli Motahharynia 提交
作者: MoRezaGHMohammadreza Ghaffarzadeh-Esfahani, Ali MotahharyniaAli Motahharynia, Nahid YousefianNahid Yousefian, Navid Mazrouei, Jafar Ghaisari, Yousof Gheisari

摘要

药物发现是一个复杂且资源密集的过程,因此早期预测批准结果对于优化研究投资至关重要。虽然经典的机器学习和深度学习方法在药物批准预测方面显示出潜力,但其有限的可解释性限制了其影响。在此,我们提出了 DrugReasoner,一个基于推理的大型语言模型(LLM),它构建在 LLaMA 架构之上,并使用群组相对策略优化(GRPO)进行微调,以预测小分子批准的可能性。DrugReasoner 集成了分子描述符与对结构相似的已批准和未批准化合物的比较推理,生成带有逐步推理和置信度评分的预测。DrugReasoner 在验证集上取得了 0.732 的 AUC 和 0.729 的 F1 分数,在测试集上分别为 0.725 和 0.718,表现稳健。这些结果优于包括逻辑回归、支持向量机和 k-近邻在内的传统基线方法,并且在 XGBoost 方面表现具有竞争力。在一个外部独立数据集上,DrugReasoner 的表现优于基线方法和最近开发的 ChemAP 模型,AUC 达到 0.728,F1 分数达到 0.774,同时保持了高精度和平衡的灵敏度,证明了在现实场景中的稳健性。这些发现表明,DrugReasoner 不仅提供了具有竞争力的预测准确性,还通过其推理输出增强了透明度,从而解决了 AI 辅助药物发现中的一个关键瓶颈。本研究强调了增强推理能力的大型语言模型作为制药决策的可解释且有效的工具的潜力。
查看 arXiv 页面查看 PDF

评论

Ali MotahharyniaAli Motahharynia
论文作者
论文提交者

我们介绍了 DrugReasoner,这是一款旨在根据分子特征预测药物审批结果的增强型 LLM。与传统的机器学习模型不同,它不仅能预测,还能解释原因。通过结合可解释性和强大的性能,DrugReasoner 为制药研究中更透明、更值得信赖的人工智能打开了大门。