Entity Alignment with Noisy Annotations from Large Language Models

2024年05月27日
  • 简介
    实体对齐(EA)旨在通过识别等价实体对来合并两个知识图谱(KGs)。虽然现有方法严重依赖于人工生成的标签,但在现实场景中引入跨领域专家进行注释是极其昂贵的。大型语言模型(LLMs)的出现为通过注释自动化EA提供了新的途径,受其处理语义信息的全面能力的启发。然而,直接应用LLMs进行EA并不是微不足道的,因为实际KG中的注释空间很大。LLMs也可能生成噪声标签,这可能会误导对齐。为此,我们提出了一个统一的框架LLM4EA,以有效利用LLMs进行EA。具体而言,我们设计了一种新颖的主动学习策略,通过基于整个KG间和KG内结构的最有价值的实体优先考虑,显著减少了注释空间。此外,我们引入了一个无监督的标签细化器,通过深入的概率推理不断提高标签的准确性。我们根据基础EA模型的反馈迭代地优化策略。广泛的实验表明,LLM4EA在四个基准数据集上在有效性,鲁棒性和效率方面具有优势。
  • 图表
  • 解决问题
    论文旨在解决实体对齐(EA)中的标注代价高的问题,提出一种利用大语言模型(LLMs)的自动EA框架。
  • 关键思路
    论文提出了一种新的主动学习策略,通过优先考虑整个跨KG和内部KG结构中最有价值的实体,显著减少注释空间。此外,引入了一种无监督标签细化器,通过深入的概率推理不断提高标签准确性。该框架通过反馈和基础EA模型进行迭代优化。
  • 其它亮点
    论文在四个基准数据集上进行了广泛的实验,证明了LLM4EA在效率、鲁棒性和有效性方面的优势。此外,论文还开源了代码。
  • 相关研究
    相关研究包括:《Bootstrapping Entity Alignment with Knowledge Graph Embeddings》、《Cross-lingual Entity Alignment via Joint Attribute-Preserving Embedding》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论