近年来,由于图结构的强大表现力,用机器学习方法分析图的研究越来越受到重视。图神经网络(GNN)是一类基于深度学习的处理图域信息的方法。由于其较好的性能和可解释性,现已被广泛应用到各个领域。

在本文中,来自Criteo AI Lab的机器学习研究科学家 Sergei Ivanov 盘点了一下 2021 年需要了解的 GNN 应用热点,涵盖了推荐系统、组合优化、计算机视觉、物理 / 化学以及药物发现等领域。

下面是要点摘录:

推荐系统:标准的案例是对用户于商品的交互关系进行建模,然后以某种形式的负采样损失学习节点嵌入,并使用 KNN 索引实时检索给定用户的相似商品。例如Uber Eats的GraphSage 网络;此外,对于大规模用户和产品平台使用GNN,推荐考察阿里巴巴的Aligraph ,以及Pinterest的 PinSage 模型等。

组合优化:组合优化(combinatorial optimization, CO)问题的求解是金融、物流、能源、生命科学和硬件设计中的关键。例如硬件方面,谷歌大脑团队利用 GNN 模型与策略和收益强化学习(RL)功能相结合,生成优化的电路芯片布局,甚至优于手工设计的硬件布局;另一种方法是将 ML 模型集成到现有求解器中,例如Gasse 等提出了一种用于学习分支定界变量选择策略的图网:混合整数线性规划(MILP)求解器中的关键步骤等。

计算机视觉:

  • 场景图(论文《Scene Graph Generation by Iterative Message Passing》),即出现在图像中的对象以及它们之间关系的集合。场景图已在图像检索、理解和推理、字幕生成、视觉问答以及图像生成中得到了应用,该方法可以极大地提高模型的性能。
  • 图形匹配。3D 图形公司 Magic Leap 发布了一种名为 SuperGlue 的 GNN 体系架构,该架构可在实时视频中执行图形匹配,用于 3D 重建、位置识别、本地化和映射(SLAM)等任务。

物理/化学:将粒子或分子之间的交互表示为一个图,然后用 GNN 预测这类系统的性质。例如,在 Facebook 和 CMU 的开放催化器项目(Open Catalyst Project)项目中,最终目的是找到储存太阳能或风能等可再生能源的新方法。DeepMind 的研究者还应用 GNN 来模拟水或沙等复杂粒子系统的动力学过程。此外,位于美国的物理实验室费米国立加速器实验室(Fermilab)致力于将 GNN 迁移到 CERN 的大型强子对撞机(LHC)的结果分析上。

药物发现:在生物学中,图可以表示为不同规模的交互。在分子水平上,图的边缘可以是分子中原子之间的键或蛋白质中氨基酸残基之间的相互作用。而在更大的范围内,图可以表示更复杂的结构(如蛋白质、mRNA 或代谢物)之间的相互作用。根据特定的抽象层次,这些图可用于目标识别、分子性质预测、高通量筛选、新型药物设计、蛋白质工程和药物再利用等领域。使用 GNN 进行药物发现最有希望的是 2020 年 MIT 研究者以及合作者发表在《细胞》(Cell)上的文章《A Deep Learning Approach to Antibiotic Discovery》。在这项研究中,他们提出了一种被称为 Chemprop 的深度 GNN 模型,用来预测分子是否具有抗生素特性:对大肠杆菌的生长抑制作用。

更多详细内容,可阅读:

内容中包含的图片若涉及版权问题,请及时与我们联系删除