今天给大家介绍的是2022年Mila、蒙特利尔、剑桥大学等机构发表的一篇论文:"Protein Representation Learning by Geometric Structure Pretraining"。作者开发了一个通用的蛋白质编码器(几何感知关系图神经网络(GearNet)),它通过添加不同类型的结构边来编码空间信息,然后在蛋白质图上执行关系消息传递(还加入了一种边缘消息传递机制来增强蛋白质结构编码器。作者提到,这是首次尝试将边缘级别的消息传递结合到蛋白质结构理解中,也是蛋白质结构建模领域的新颖之处,以前的工作只考虑残基或原子之间的消息传递)。利用多视图对比学习和不同的自预测任务来预训练蛋白质图编码器。最终实验结果表明,模型在不到100万个样本上的训练获得了与在100万或10亿级数据集上预训练的最先进的基于序列的编码器相媲美甚至更好的结果。
论文链接:https://arxiv.org/abs/2203.06125v2
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢