Expressivity and Generalization: Fragment-Biases for Molecular GNNs

International Conference on Machine Learning. 2024. Oral
2024年06月12日
  • 简介
    尽管最近高阶图神经网络(GNNs)的进展提高了理论表达能力和分子属性预测性能,但它们通常无法达到明确使用片段信息作为归纳偏置的模型的经验性能。然而,对于这些方法,不存在理论表达能力研究。在本文中,我们提出了片段-WL测试,这是著名的Weisfeiler&Leman(WL)测试的扩展,它使得可以对这些片段偏置的GNN进行理论分析。基于从片段-WL测试中获得的见解,我们开发了一种新的GNN架构和具有无限词汇量的分割方法,显著提高了表达能力。我们展示了我们的模型在合成和真实数据上的有效性,在Peptides上超过了所有GNNs,并比ZINC上所有GNNs的误差低12%,比其他片段偏置模型的误差低34%。此外,我们展示了我们的模型相对于最新的基于transformer的架构具有优越的泛化能力,将其定位为一种强大的分子建模任务的解决方案。
  • 图表
  • 解决问题
    本文试图解决基于分子片段信息的图神经网络(GNNs)在实际性能上不如使用WL测试的模型的问题,并提出了一种新的GNN架构和无限词汇量的分解方法来提高模型表达能力和预测性能。
  • 关键思路
    本文提出了Fragment-WL测试,扩展了著名的Weisfeiler & Leman(WL)测试,可以对基于分子片段信息的GNNs进行理论分析。通过Fragment-WL测试的启示,本文提出了一种新的GNN架构和分解方法,显著提高了模型的表达能力和预测性能。
  • 其它亮点
    本文在合成和现实数据上进行了实验,表明所提出的模型在Peptides数据集上优于所有GNNs,并且比其他基于片段偏差的模型的误差低12%的ZINC数据集和34%。此外,本文还表明,与最新的基于变压器的架构相比,所提出的模型具有更好的泛化能力,是一种强大的解决分子建模任务的方法。
  • 相关研究
    最近在这个领域中,还有一些相关研究,例如:'Molecular Property Prediction: A Multilevel Quantum Interactions Modeling Perspective','Molecule Attention Transformer','Graph Convolutional Networks for Molecular Property Prediction'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论