Relational Deep Learning: Graph Representation Learning on Relational Databases

2023年12月07日
  • 简介
    世界上许多最有价值的数据存储在关系数据库和数据仓库中,数据被组织成许多表格,并通过主外键关系相互连接。然而,使用这些数据构建机器学习模型既具有挑战性又耗时。核心问题在于,没有一种机器学习方法能够在由主外键关系连接的多个表格上进行学习。目前的方法只能从单个表格中学习,因此数据必须首先手动连接和聚合成单个训练表格,这个过程称为特征工程。特征工程是缓慢、容易出错的,并且会导致次优模型。在这里,我们介绍了一种端到端的深度表示学习方法,直接在跨越多个表格的数据上进行学习。我们称之为关系深度学习(RDL)。核心思想是将关系数据库视为一个时间、异构图,每个表格中的每一行都有一个节点,并且边由主外键链接指定。消息传递图神经网络可以自动跨越图进行学习,提取利用所有输入数据的表示,无需进行任何手动特征工程。关系深度学习可以带来更准确的模型,而且构建速度更快。为了促进这个领域的研究,我们开发了RelBench,一组基准数据集和关系深度学习的实现。数据涵盖了广泛的领域,从Stack Exchange上的讨论到Amazon产品目录上的书评。总的来说,我们定义了一个新的研究领域,推广了图机器学习的适用性,扩展了其适用于广泛的人工智能用例。
  • 作者讲解
  • 图表
  • 解决问题
    如何直接在跨多个表格的关系型数据库中进行机器学习建模?
  • 关键思路
    将关系型数据库视为时间异构图,使用消息传递图神经网络自动学习跨整个图的表示,从而避免手动特征工程。
  • 其它亮点
    论文提出了一种名为Relational Deep Learning(RDL)的端到端深度学习方法,可以直接在跨多个表格的关系型数据库中进行机器学习建模,避免了手动特征工程。论文提供了一个包含多个数据集的基准测试套件RelBench,并提供了实现代码。该方法可以应用于广泛的人工智能领域。
  • 相关研究
    相关研究包括Graph Convolutional Networks(GCN)、Graph Attention Networks(GAT)等基于图的机器学习方法。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问