ReMatch: Retrieval Enhanced Schema Matching with LLMs

2024年03月03日
  • 简介
    本文介绍了数据集成中的一个关键任务——模式匹配,其涉及将源模式与目标模式对齐以建立它们之间元素的对应关系。由于文本和语义的异构性以及模式大小的差异,这项任务具有挑战性。虽然许多研究已经探索了基于机器学习的解决方案,但它们通常存在精度低的问题,需要手动映射模式进行模型训练,或需要访问可能由于隐私问题而不可用的源模式数据。本文提出了一种名为ReMatch的新方法,使用检索增强的大型语言模型(LLMs)匹配模式。我们的方法避免了预定义映射、任何模型训练或访问源数据库中的数据的需要。我们在大型真实世界模式上的实验结果表明,ReMatch是一种有效的匹配器。通过消除训练数据的要求,ReMatch成为了实际场景下的可行解决方案。
  • 图表
  • 解决问题
    本论文旨在解决数据集成中的模式匹配问题,即如何将源模式与目标模式对齐以建立它们之间的对应关系。这是一个长期存在的问题,但由于文本和语义异构性以及模式大小的差异而具有挑战性。
  • 关键思路
    论文提出了一种名为ReMatch的新方法,使用检索增强的大型语言模型(LLM)进行模式匹配。该方法避免了预定义映射、模型训练或访问源数据库中的数据的需要。
  • 其它亮点
    论文的实验结果表明,ReMatch是一种有效的匹配器。通过消除训练数据的要求,ReMatch成为现实世界场景的可行解决方案。
  • 相关研究
    在最近的相关研究中,也有一些使用机器学习方法解决模式匹配问题的论文,但它们通常存在精度低、需要手动映射模式进行模型训练或需要访问源模式数据等问题。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论