⏶23
适应度对齐的结构建模通过AuroBind实现可扩展的虚拟筛选
发表
由
Siqi Sun 提交
作者:
Zhongyue Zhang, Jiahua Rao, Jie Zhong,
Weiqiang Bai, Dongxue Wang, Shaobo Ning, Lifeng Qiao, Sheng Xu, Runze Ma, Will Hua, Jack Xiaoyu Chen, Odin Zhang, Wei Lu, Hanyi Feng, He Yang, Xinchao Shi, Rui Li, Wanli Ouyang, Xinzhu Ma, Jiahao Wang, Jixian Zhang, Jia Duan, Siqi Sun, Jian Zhang, Shuangjia Zheng
摘要
大多数人类蛋白质仍未被开发成药物,超过96%的人类蛋白质尚未被已批准的疗法所利用。虽然基于结构的虚拟筛选有望扩展可成药的蛋白质组,但现有方法缺乏原子级的精度,且无法预测结合适应性,这限制了其转化应用。我们提出了AuroBind,一个可扩展的虚拟筛选框架,它利用百万级别的化学基因组学数据对一个定制的原子级结构模型进行微调。AuroBind整合了直接偏好优化、来自高置信度复合物的自蒸馏以及师生加速策略,以共同预测配体结合结构和结合适应性。所提出的模型在结构和功能基准测试中均优于当前最先进的模型,同时能以快10万倍的速度在超大型化合物库中进行筛选。在一项针对十个疾病相关靶点的前瞻性筛选中,AuroBind实现了7-69%的实验命中率,其中顶尖化合物的效力达到了亚纳摩尔至皮摩尔级别。对于孤儿GPCR GPR151和GPR160,AuroBind成功识别出激动剂和拮抗剂,成功率达16-30%,功能性实验证实了GPR160在肝癌和前列腺癌模型中的调节作用。AuroBind为结构-功能学习和高通量分子筛选提供了一个可泛化的框架,弥合了结构预测与药物发现之间的鸿沟。
我们引入了 AuroBind,该方法集成了直接偏好优化、来自高置信度复合物的自蒸馏以及师生加速策略,以共同预测配体结合结构和结合适应度。AuroBind 的实验命中率达到了 7-69%,其中顶尖化合物的效力达到了亚纳摩尔至皮摩尔级别。
代码和预训练权重的轻量级版本可在以下地址获取:https://github.com/GENTEL-lab/AuroBind