

在“迈向几何深度学习”系列的最后一篇文章中,我们将讨论GNN的早期原型如何在20世纪60年代的化学领域出现。这篇文章基于M. M. Bronstein,J. Bruna,T. Cohen和P. Veličković 合著的《Geometric Deep Learning》(完稿后将由麻省理工学院出版社出版)书的介绍章节,以及我们开设的非洲机器智能硕士(AMMI)课程内容。请参阅我们讨论对称性的第一篇文章,以及关于神经网络早期历史、“AI冬天”的第二篇文章,以及研究第一个“几何”架构的第三篇文章


化学在历史上一直是——现在仍然是——数据最密集的学科之一。十八世纪现代化学的出现导致了已知化合物的快速增长和对其组织的早期需求。这个角色最初由Chemisches Zentralblatt[1]和“化学词典”等期刊扮演,如Gmelins Handbuch der anorganischen Chemie(1817年首次出版的无机化合物的早期纲要[2])和Beilsteins Handbuch der organischen Chemie(有机化学的类似出版物) —— 所有这些都最初以德语出版,直到20世纪初才成为科学的主要语言。






图注:苯(C₆H₆)的结构式由19世纪的德国化学家奥古斯特·凯库莱(August Kekulé)提出,并对苯环进行了现代描述。据说,凯库莱的灵感来自于一个梦中看到一条蛇咬自己的尾巴。



图注:化合物及其针对不同系统的密码示例。图片来自 [13]。



图注:乔治·弗拉杜特(George Vlăduţ)1959年论文[13]中的一个数字显示了一种化学分子及其碎片以及相应的GKD密码。请注意,这种编码系统破坏了分子中连接原子的空间局部性,使得片段密码无法通过完整分子的简单子字符串匹配找到。早期化学表示方法的这个缺点是用图形来搜索分子结构的动机之一。

这种认识鼓励了“拓扑密码”的发展,它试图捕获分子的结构。这方面的第一批工作是在陶氏化学公司[7]和美国专利局[8]完成的,它们都是化学数据库的重度用户。其中最著名的描述符之一,被称为“摩根指纹”[9],由Harry Morgan在化学文摘服务社[10]开发,并一直使用到今天。



在开发早期搜索化学数据库的“结构”方法方面发挥关键作用的人物是罗马尼亚出生的苏联研究员George Vlăduţ[11]。作为一名训练有素的化学家(他于1952年在莫斯科门捷列夫研究所攻读有机化学博士学位),他在大一时经历了一次与庞大的Beilstein手册的“痛苦”相遇[12],使得他的研究兴趣转向了化学信息学[13]——他余生为之奋斗的领域。

Vlăduţ被认为是使用图论来模拟化合物结构和反应的先驱之一。从某种意义上说,这并不奇怪:图论在历史上一直与化学联系在一起,甚至“图”这个词(指一组节点和边缘,而不是函数的图)也是由数学家James Sylvester在1878年引入的,作为化学分子的数学抽象[14]。

图注:术语“图”(在图论中使用的意义上)最初是由James Sylvester在1878年的《自然》杂志笔记中作为分子模型引入的[14]。


Vlăduţ的工作启发了一对年轻的研究人员[16],Boris Weisfeiler(代数几何学家)和Andrey Lehman[17](自称为“程序员”[18])。在一篇经典的联合论文[19]中,两人引入了一种迭代算法来测试一对图是否同构(即,这些图具有相同的结构,直到节点重新排序),这被称为Weisfeiler-Lehman(WL)测试[20]。虽然两人从上学时代就认识了,但他们在出版后不久便分道扬镳、在各自的领域发展了[21]。


图注:1968年Andrei Lehman和Boris Weisfeiler引入的图同构测试。







图神经网络的早期形式至少可以追溯到20世纪90年代,其中的例子包括Alessandro Sperduti的“Labeling RAAM”[29],Christoph Goller和Andreas Küchler的“通过结构反向传播”[30],以及数据结构的自适应处理[31-32]。虽然这些作品主要关注在“结构”(通常是树或有向无环图)上运行,但其架构中保留的许多不变性让人想起今天更常用的GNN。

图注:迈向图神经网络:20世纪90年代的早期工作侧重于学习泛型结构,如树或有向无环图。术语“图神经网络”是在Marco Gori和Franco Scarselli的经典论文中引入的。

第一次正确处理通用图结构(以及术语“图神经网络”的创造)发生在21世纪之交之后。由Marco Gori[33]和Franco Scarselli[34]领导的锡耶纳大学团队提出了第一个“GNN”。他们依赖于递归机制,需要神经网络参数来指定收缩映射,从而通过搜索固定点来计算节点表示 ——这本身就需要一种特殊形式的反向传播,并且根本不依赖于节点特征。上述所有问题都由Yujia Li的 Gated GNN (GGNN)模型[35]进行了纠正,该模型带来了现代RNN的许多好处,例如门控机制[36]和随时间的反向传播。

Alessio Micheli大约在同一时间提出的图神经网络(NN4G)[37]使用前馈而不是循环架构,实际上更类似于现代GNN。

图注:作者与GNN先驱Marco Gori和Alessandro Sperduti在WCCI 2022。

另一类重要的图神经网络,通常被称为“谱”,已经从Joan Bruna和合著者的工作中出现[38],使用图傅里叶变换的概念。这种结构的根源在于信号处理和计算谐波分析社区,其中非欧几里得信号的处理在2000年代末和2010年代初变得突出[39]。

来自Pierre Vandergheynst [40]和José Moura[41]小组的一系列重要论文推广了“图信号处理”(GSP)的概念以及基于图邻接和拉普拉斯矩阵的特征向量的傅里叶变换的推广。依赖于Michaël Defferrard[42]和Thomas Kipf和Max Welling[43]的频谱滤波器的图卷积神经网络,是该领域引用最多的网络之一。



经过一个有点讽刺意味的命运转折,现代GNNs胜利地重新引入化学领域,它们起源于这个领域:由David Duvenaud[44]作为手工制作的摩根分子指纹的替代品,以及Justin Gilmer[45]以类似于Weisfeiler-Lehman测试的消息传递神经网络形式[26-27]。五十年后,这个圈子终于形成了闭环。

图注:图神经网络的现代版本随着David Duvenaud和Justin Gilmer的作品胜利地回归化学。

图神经网络现在是化学领域的标准工具,并且已经在药物发现和设计管道中使用。2020年基于GNN的新型抗生素化合物发现[46]获得了显着的赞誉。DeepMind的AlphaFold 2 [47]使用等变注意力(一种解释原子坐标连续对称性的GNN形式)来解决结构生物学的“圣杯”——蛋白质折叠的问题。

1999年,Andrey Lehman写信给一位数学家同事说,他“很高兴得知'魏斯费勒-莱曼'是众所周知的,并且仍然引起了人们的兴趣“,他没有活着看到基于他五十年前的工作的GNN的兴起。George Vlăduţ没有看到他思想的实现,其中许多思想在他有生之年一直留在纸上。但我们相信,他们会为开创了这个令人兴奋的新领域的源头而感到自豪。



