动态时空图数据结构在多种不同的学科中均普遍存在,如交通流、空气质量观测、社交网络等,这些观测往往会随着时间而变化,进而引发节点间关联的动态时变特性。本文的主要研究对象是动态时空图的回归任务,赋能交通、空气质量和气候预测。动态图学习中聚合偏离目标信息的邻居会导致图学习性能下降,因而我们重新审视了节点的邻居关系,通过对邻居关联进行分类并筛选有助于预测的有效信息进行聚合。

在本文中,我们借助图学习中的“同配性理论(homophily theory)”,提出了动态图“目标同配性度量方法”和“逐层重要性量化策略”,将同配性理论从静态图拓展至具有时空特性的动态图中。其中,目标同配理论捕获了目标状态与当前状态的差异性,通过构建有向符号以动态地、针对性地选择与目标一致的同配节点,即有效邻居实现节点级聚合;层重要性量化利用局部拓扑环境和目标感知度量不同传播层的有效信息量,以实现逐层有效传播。

本文在 ICLR 2023 评审过程中得分为 8,8,6,6,被接收为 Poster。
图片

论文标题:

GReTo: Remedying Dynamic Graph Topology-Task Discordance via Target Homophily

论文地址:

https://openreview.net/pdf?id=8duT3mi_5n

 

研究动机

拓扑-任务不一致性:现有的动态图回归任务往往使用图卷积神经网络(GCN),以物理连接或特征相似度构建邻接矩阵来进行节点级聚合。
如图 1 所示,以交通流量为例,节点 A 从 T 至 T+1 时间步发生了明显的流量增加,而此时在 T 步聚合大于其本身的节点 C/D/G 将是有效获得目标的策略,反之聚合其他节点则可能导致与任务目标相悖的结果,因而不是所有的(预定义)物理的拓扑均为有效,而当节点 A 在时序层面变化较大,则可能在 T 步直接聚合同配邻居也将失效。

因此,鉴于动态时空图具有节点关系多样性、动态性和时序演进关系,直接利用同配邻居或某一固定的拓扑结构进行消息传递会不可避免地导致某些时间步的聚合偏离回归目标,我们将这种现象称为拓扑-任务的不一致。因而在时空动态图中拓扑-任务不一致问题是推动动态图预测更精准的必经之路,同时将开拓动态图理论分析、动态图拓扑优化的新方法与新思路。

图片
▲ 图1 拓扑-任务不一致性示意图
这一问题的本质原因在于时空图所具有的本质时空异质性,这种异质性体现在不同的时间步、不同区域所具有的节点观测不尽相同,进而带来不同时间步的空间关联和时序依赖关系的不一致性。
在图学习理论中,同配性度量刻画了节点间的关系,其中,若有边相连的一对邻居节点具有相似观测或相同标签,那么这对邻居是一组同配成分,反之,若有边相连的一组邻居具有不同观测或不同的标签,那么其为一组异配成分,而时空动态图上往往同时存在同配和异配成分。
这种关联识别与解耦恰恰为我们的有效节点选择带来了潜在可能。然而,传统的同配性理论大多在静态图和分类任务中开展研究,很少在跨时间步、具有连续观测的动态图回归任务上进行研究,因此,我们认为基于同配理论实现个性化聚合仍然存在以下几个挑战:
1. 如何基于连续值确定节点间的同配关系,并将这种刻画节点关联的范式拓展至连续数据观测?
2. 如何利用不同节点在时序方面的演进趋势和当前节点间的关联,筛选有利于达成预测目标的有效邻居?
3. 如何量化局部邻域信息与目标信息的关联,实现时空异质环境下的图信号高阶传播?
为解决以上挑战,我们重新审视了节点关系,利用同配关系的定义拓展了具有符号和距离的动态图上节点关系度量机制。我们发现,在预测任务中,将同配聚合提升为有符号的目标引导的消息传递,可以有效地解决上述提出的拓扑-任务不一致问题,提高聚合能力。
因此,本文提出了一种新的图神经网络 GReTo,该模型通过构建目标同配性度量来选择有效邻居,进而修正时空数据预测中的拓扑-任务不一致。贡献总结如下:
1. 我们提出了时空图中因异质性带来的拓扑-任务的不一致问题,形式化了动态图同配理论,将同配性理论从静态图分类任务拓展至动态图回归任务,利用图学习理论进一步拓展了时空数据性质分析和时空学习建模方法;
2. 我们提出了一个基于目标同配性修正拓扑结构的图神经网络并建模时空异质性,其包括基于目标同配的有符号信息传递和基于层重要性的高阶图信号传播;

3. 我们在交通、气候、空气质量等不同领域的四个动态图上评估了我们的解决方案,并成功地在 MAPE 指标上实现了 3.20% 到 24.79% 的提升,并表明负异配性越高,有符号的有向消息传递机制将不同成分解耦并聚合的优势越明显。

内容中包含的图片若涉及版权问题,请及时与我们联系删除