【论文标题】Knowledge-aware Contrastive Molecular Graph Learning 【作者团队】Yin Fang, Haihong Yang, Xiang Zhuang, Xin Shao, Xiaohui Fan, Huajun Chen 【发表时间】2021/03/24 【机 构】浙大,中国 【论文链接】https://arxiv.org/abs/2103.13047v 【推荐理由】成功将热门的知识和对比学习融入了分子图预训练中。

在分子特征学习中利用包括指纹和官能团在内的领域知识对化学性质预测和药物发现至关重要。在对分子图结构和分子性质之间的关系进行建模时,现有的工作很难捕捉到结构或特性的变化和原子种类分布不平衡的复杂结构。本文提出了用于自监督分子表征学习的对比知识感知图神经网络(CKGNN),将领域知识融合到分子图表征中。在对比学习框架下,作者通过CKGNN编码领域知识,确保生成的分子嵌入具备化学领域知识,以区分化学式相似但功能不同的分子。文章共在8个公共数据集上的广泛实验证明了其模型的有效性,平均上有6%的效果提升。

上表展示了一般GNN和知识感知对比GNN之间的比较。往往不具备知识的GNN在化学领域上都都表现地很脆弱,这是由于很小的结构变化可能导致不同的功能变化。

上图为CKGNN的架构,共分为2部分:知识感知分子编码器,和基于分子聚类策略的分子对比学习框架。 在知识感知分子编码器中,每个原子均有2种节点特征表征,原子特征和官能团特征(源自Daylight官能团划分),并最终以经过GNN的隐变量为分子特征。在基于分子聚类策略的分子对比学习框架中,上百万分子被分成43类,在每类内,随机抽取N个分子采样。将每个分子作为anchor,选择指纹最相似的的分子作为相似实例,将其余的分子作为异构实例进行对比学习。

可以看到上述框架的训练下,CKGNN对于分子官能团对的相似度度量能力优于分子对比学习方法GCC以及分子预训练方法P-GIN