ReMatch: Retrieval Enhanced Schema Matching with LLMs

简介

本文介绍了数据集成中的一个关键任务——模式匹配，其涉及将源模式与目标模式对齐以建立它们之间元素的对应关系。由于文本和语义的异构性以及模式大小的差异，这项任务具有挑战性。虽然许多研究已经探索了基于机器学习的解决方案，但它们通常存在精度低的问题，需要手动映射模式进行模型训练，或需要访问可能由于隐私问题而不可用的源模式数据。本文提出了一种名为ReMatch的新方法，使用检索增强的大型语言模型（LLMs）匹配模式。我们的方法避免了预定义映射、任何模型训练或访问源数据库中的数据的需要。我们在大型真实世界模式上的实验结果表明，ReMatch是一种有效的匹配器。通过消除训练数据的要求，ReMatch成为了实际场景下的可行解决方案。
图表
解决问题

本论文旨在解决数据集成中的模式匹配问题，即如何将源模式与目标模式对齐以建立它们之间的对应关系。这是一个长期存在的问题，但由于文本和语义异构性以及模式大小的差异而具有挑战性。
关键思路

论文提出了一种名为ReMatch的新方法，使用检索增强的大型语言模型（LLM）进行模式匹配。该方法避免了预定义映射、模型训练或访问源数据库中的数据的需要。
其它亮点

论文的实验结果表明，ReMatch是一种有效的匹配器。通过消除训练数据的要求，ReMatch成为现实世界场景的可行解决方案。
相关研究

在最近的相关研究中，也有一些使用机器学习方法解决模式匹配问题的论文，但它们通常存在精度低、需要手动映射模式进行模型训练或需要访问源模式数据等问题。

ReMatch: Retrieval Enhanced Schema Matching with LLMs

评论