论文链接:

https://arxiv.org/pdf/2109.11730.pdf

摘要

近年来,人们致力于将图神经网络(GNNs)应用于分子性质预测,这是计算药物和材料发现的一项基本任务。阻碍GNNs成功预测分子性质的主要障碍之一是标记数据的缺乏。虽然图对比学习(GCL)方法在标记数据不足的情况下取得了非凡的性能,但大多数方法集中为一般图设计数据增强的方案。然而,在分子图上进行数据增强的方法(如随机扰乱)可能会改变分子的基本性质。在当前的GNN和GCL体系结构下,分子关键几何的信息仍然很少被探索。

本文提出了一种新的名为GeomGCL的图对比学习方法,该方法利用了分子在2D和3D视图中的几何结构。具体来说,作者首先设计了一个双视图几何信息传递网络(GeomMPNN),以自适应地利用分子的2D图和3D图的丰富信息。不同层次的几何性质的结合可以极大地促进分子表征的学习。然后设计了一种新的几何图对比学习方案,使两个几何视图可以协同监督,从而提高GeomMPNN的泛化能力。通过微调GeomGCL对各种下游属性预测任务进行评估。在七个真实分子数据集上的实验结果证明了作者提出的GeomGCL相对于最新基线的有效性。

内容中包含的图片若涉及版权问题,请及时与我们联系删除