多目标导向的离散流匹配用于可控生物序列设计

发表
Pranam ChatterjeePranam Chatterjee 提交
作者: Tong Chen, zYinuo Zhang, Sophia TangSophia Tang, Pranam ChatterjeePranam Chatterjee

摘要

设计满足多个、往往相互冲突的功能和生物物理标准的生物序列,仍然是生物分子工程中的一个核心挑战。虽然离散流匹配模型 (discrete flow matching models) 最近已展现出在高维序列空间中进行高效采样的潜力,但现有方法仅针对单一目标,或需要可能扭曲离散分布的连续嵌入。我们提出了多目标引导的离散流匹配 (MOG-DFM),这是一个通用框架,用于引导任何预训练的离散时间流匹配生成器,在多个标量目标之间实现帕累托最优权衡。在每个采样步骤中,MOG-DFM 为候选转换计算一个混合的排序方向性分数,并应用一个自适应超锥过滤器,以确保一致的多目标进展。我们还训练了两个无条件离散流匹配模型,PepDFM 用于多样化肽段生成,以及 EnhancerDFM 用于功能性增强子 DNA 生成,作为 MOG-DFM 的基础生成模型。我们展示了 MOG-DFM 在生成针对五种属性(溶血性、防污性、溶解度、半衰期和结合亲和力)进行优化的肽段结合物,以及在设计具有特定增强子类别和 DNA 形状的 DNA 序列方面的有效性。总的来说,MOG-DFM 被证明是一个强大的工具,可用于多属性引导的生物分子序列设计。
查看 arXiv 页面查看 PDF

评论

Pranam ChatterjeePranam Chatterjee
论文作者
论文提交者

mog-dfm.png