今天给大家介绍一篇深势科技发表于ICLR2023的论文“Uni-Mol: A Universal 3D Molecular Representation Learning Framework”。这篇论文发表了一个泛用的预训练框架用于分子表示学习,并在大量下游任务中达到了SOTA。

论文链接:https://openreview.net/pdf?id=6K2RM6wVqKu

 

 分子表示学习(MRL)由于其在药物设计等应用中发挥重要作用而获得了极大的关注。在大多数MRL方法中,分子被视为1D序列符号或2D拓扑图,限制了它们为下游任务合并3D信息的能力,特别是使得3D几何预测/生成几乎不可能。本文提出了一种泛用的3D MRL框架Uni-Mol,极大地扩展了MRL方案的表示能力和应用范围。Uni-Mol包含两个具有相同SE(3)-Transformer架构的预训练模型:一个由209M个分子构象预训练的分子模型;一个由3M候选蛋白口袋数据预训练的口袋模型。此外,Uni-Mol包含几种微调策略,将预训练的模型应用于各种下游任务。通过适当地结合3D信息,Uni-Mol在14/15分子性质预测任务中优于SOTA。此外,UniMol在蛋白质配体结合姿势预测、分子构象生成等3D空间任务中表现优异。贡献:1)Uni-Mol是一个能够直接用于3D任务的分子预训练框架;2)基于大量的基准,作者提出一个简单有效的SE(3)-Transformer作为骨干网络,并为模型设计了一个3D预训练的策略;3)Uni-Mol在多种下游任务中超越了SOTA。图片

内容中包含的图片若涉及版权问题,请及时与我们联系删除