编者按:“几何深度学习”先驱、牛津大学DeepMind教授Michael Bronstein 最近在博客发表系列长文《迈向几何深度学习》的第1篇:站在巨人的肩膀上。下文是对它的编译。


几何深度学习从对称性和不变性的角度来处理广泛的 ML 问题,为 CNN、GNN 和 Transformers 等神经网络架构提供了通用的蓝图。我们在一系列新发表的文章里,研究了从古希腊几何到图神经网络的历史中,这些想法是如何出现的。


雪花和标准模型有什么共同点?对称。在“迈向几何深度学习”系列的第一篇文章中,我们将讨论对称性的概念如何帮助组织十九世纪动物园的几何结构并彻底改变理论物理学。这篇文章基于M. M. Bronstein,J. Bruna,T. Cohen和P. Veličković 合著的《Geometric Deep Learning》(完稿后将由麻省理工学院出版社出版)书的介绍章节,以及我们开设的非洲机器智能硕士(AMMI)课程内容。请参阅我们已经总结的关于几何深度学习概念的文章。







“对称性,无论你对它的定义有多么宽泛或者狭窄,它均是人类历代以来试图理解和创造秩序、美丽和完美的一个构思”——赫尔曼·韦尔(Hermann Weyl,1952)

这个颇有诗意的对称性定义,来自于伟大的数学家赫尔曼·外尔(Hermann Weyl)的同名著作[1],这部“天鹅之歌”般作品出版于他在普林斯顿高等研究院的退休前夕。外尔将对称性在科学和艺术中占据的特殊地位追溯到古代,从苏美尔对称设计到毕达哥拉斯主义者——毕达哥拉斯主义者认为圆由于其旋转对称性而完美。柏拉图认为,今天以他名字命名的五个规则多面体是如此基本,以至于它们一定是塑造物质世界的基本组成部分。

然而,尽管柏拉图创造了术语συμμετρία,字面意思是“相同的措施”,但他只是模糊地用它来传达艺术中比例和音乐中的和谐之美。德国天文学家和数学家约翰内斯·开普勒(Johannes Kepler)首次对水晶体的对称形状进行了严格的分析。在他的专著《论六角雪花上》(On the Six-Cornered Snowflake)[2]中,他将雪花的六倍二面体结构归因于粒子的六角密排——这一观点,虽然在我们形成对物质构成的清晰理解之前就存在,但今天仍然作为了晶体学的基础[3]。


在现代数学中,对称性几乎是用群论的语言形式一致地表达出来。这一理论的起源通常归功于Évariste Galois,他创造了这个术语,并在1830年代用它来研究多项式方程的可解性[4]。另外两个与群论相关的名字是Sophus Lie和Felix Klein,他们曾经会面并一起富有成效地进行了合作[5]。前者发展出了连续对称理论,今天以他的名字命名(李群);后者在他的埃尔兰根纲领中宣称群论是几何学的组织原理。鉴于Klein的纲领是几何深度学习的灵感来源,因此值得花更多时间研究其历史背景和革命性影响。

埃瓦里斯特·伽罗瓦(左)和他在致命决斗前一天晚上给朋友的信,描述了群论。Felix Klein(右)和为他的教授任命准备的研究招生简章的封面,该研究招生简章已作为“埃尔兰根计划”进入了数学史。克莱因的肖像:伊霍尔·戈尔斯基。




解决平行问题的早期方法出现在十一世纪的波斯专著“关于欧几里得元素假设的困难的评论”中,作者是Omar Khayyam[6]。十八世纪的意大利耶稣会牧师乔瓦尼·萨切里(Giovanni Saccheri)可能知道这部先前的作品——从他自己的作品《欧几里得》的标题来看:Euclides ab omni nævo vindicatus(“欧几里得清除了所有污点”)。

和Khayyam方案类似,乔瓦尼·萨切里考虑了四边形的顶角,其侧面垂直于底部。锐角导致无限多的非相交线,这些线可以通过一个不在直线上的点,这一结论似乎非常违反直觉,以至于他定论为“repugnatis naturæ linæ rectæ(与直线的性质相悖”[7]。

乔瓦尼·萨切里的“Euclides vindicatus”的卷首部分,以及将双曲几何判断为“repugnatis naturæ linæ rectæ”的段落。

十九世纪时人们已经意识到第五假设并不是必需的,可以基于不同的平行概念构建可替代的几何。一个早期的例子是投影几何,顾名思义,它出现在透视绘图和建筑中。在这种类型的几何中,点和线是可以互换的,并且没有通常意义上的平行线:任何线都会在“无穷远处的点”相遇。虽然投影几何的现象自古以来就已为人所知,但首位系统地对它进行研究的,是1812年的让-维克多·庞塞莱特(Jean-Victor Poncelet)[8]。

关于非欧几何的第一次构造目前尚存争议。卡尔·弗里德里希·高斯(Carl Friedrich Gauss)在1813年左右研究过它,但从未发表过任何结果[9]。非欧几何主题的第一本出版物是俄罗斯数学家尼古拉·罗巴切夫斯基(Nikolai Lobachevsky)的《论几何的起源》(On the Origins of Geometry)[10]。在这项工作中,他认为第五假设是一个任意的限制,并提出了一个替代方案,即多条线可以穿过一个与给定点平行的点。这种构造需要一个具有负曲率的空间 - 我们现在称之为双曲空间 - 这个概念在当时还未被大家完全掌握[11]。

1823 年 11 月 3 日,亚诺什·博雅伊用匈牙利语写给父亲的信(左),宣布他发现了双曲几何。尼古拉·罗巴切夫斯基(右)和他的作品《论几何学的起源》的第一页,出版于1829年。

罗巴切夫斯基的想法似乎是异端邪说,他被同事们公开嘲笑[12]。匈牙利的János Bolyai独立地发现了类似的结构,他于1832年以“绝对几何”的名义发表了它。较早在1823年给他父亲的一封信中,他热情地写下了这一新发展:

“我发现了如此美妙的事情,我感到惊讶......凭空,我创造了一个陌生的新世界“——János Bolyai(1823)

与此同时,新的几何形状继续像聚宝盆一样出现。奥古斯特·莫比乌斯[13],因对仿射几何的研究声誉鹊起。高斯的学生伯恩哈特·黎曼(Bernhardt Riemann)在他的资格认证讲座中介绍了一类非常广泛的几何学——今天获誉为黎曼几何——随后以“Über die Hypothesen, welche der Geometrie zu Grunde liegen”(“关于几何学所基于的假设”)的标题发表[14]。黎曼几何的一个特例是球体的“椭圆”几何,这是违反欧几里得第五假设的另一种构造,因为球体上没有一个点可以画出一条从不与给定线相交的线。


正是在这种令人兴奋但又混乱的情况下,Felix Klein出现了,他以天才的洞察力,使用群论作为对称性的代数抽象来组织“几何动物园”。克莱因在埃尔兰根被任命为教授时只有23岁,按照德国大学的惯例,他被要求提供首个研究计划 - 名为Vergleichende Betrachtungen über neuere geometrische Forschungen(“对最近几何研究的比较回顾”),它已作为“埃尔兰根计划”进入数学史册[15]。







Klein在他的Vergleichende Betrachtungen [17]中抱怨说:

“数学物理学家是多么执着地无视许多情况下只需适度培养投影观点而带来的优势。”——Felix Klein(1872)

他倡导在物理学中利用几何学和对称性原理,这预示了这个领域在下一世纪中的真正革命性变化。在哥廷根[18],克莱因的同事Emmy Noether[19]证明了物理系统行为中的每个可微对称性都有相应的守恒定律[20]。无论如何,这是一个惊人的结果:事先,需要细致的实验观察来发现能量守恒定律等基本定律,即使这样,它也不是来自任何地方的经验结果。诺特定理——用诺贝尔奖获得者弗兰克·维尔切克(Frank Wilczek)的话来说,“20世纪和21世纪物理学的指路明灯”——例如,它允许证明能量守恒来自时间的平移对称性,这是一个相当直观的想法,即实验的结果不应该取决于它是今天还是明天进行。


另一个与电荷守恒相关的对称性,即电磁场的全局规范不变性,首先出现在麦克斯韦的电动力学公式中[21];然而,它的重要性最初并未引起注意。赫尔曼·外尔(Hermann Weyl)在20世纪初首次在物理学中引入了规范不变性的概念[22],他强调了它作为可以推导出电磁学的原理的作用。直到这个基本原理——由杨和米尔斯[23]开发的广义形式——被证明成功地提供了一个统一的框架来描述电磁学的量子力学行为以及弱力和强力,最终在标准模型中达到了顶峰,该模型捕获了除重力之外的所有自然界基本力。正如另一位诺贝尔奖得主菲利普·安德森(Philip Anderson)[24]简明扼要地指出的那样:

“说物理学是关于对称性的研究,仅仅是略微夸大其词而已。”——菲利普·安德森(Philip Anderson,1972)



