Cascading Large Language Models for Salient Event Graph Generation

2024年06月26日
  • 简介
    从长篇文档中生成事件图谱是具有挑战性的,因为涉及多个任务的固有复杂性,如检测事件、识别它们之间的关系以及将非结构化输入与结构化图谱协调一致。最近的研究通常认为所有事件具有相同的重要性,未能区分对于理解叙述至关重要的显著事件。本文提出了CALLMSAE,这是一个用于生成突出事件图谱的级联大语言模型框架,利用了LLM的能力,并消除了昂贵的人类注释的需求。我们首先通过提示LLM生成摘要来识别显著事件,从中识别显著事件。接下来,我们开发了一个迭代的代码细化提示策略来生成事件关系图,删除虚假的关系并恢复缺失的边缘。在LLM生成的图上微调上下文化图生成模型优于在CAEVO生成的数据上训练的模型。在人类注释的测试集上进行的实验结果表明,所提出的方法生成了突出且更准确的图谱,优于竞争基线。
  • 图表
  • 解决问题
    论文旨在解决从长文档中生成事件图的挑战,包括检测事件、识别它们之间的关系以及将非结构化输入与结构化图形相协调。同时,论文试图区分重要的事件,以便更好地理解叙述。
  • 关键思路
    论文提出了一个名为CALLMSAE的框架,利用LLMs的能力,通过迭代代码细化提示策略生成事件关系图,并消除虚假关系和恢复缺失的边缘。通过对LLM生成的图进行微调,超越了在CAEVO生成的数据上训练的模型。这个方法生成的图更准确,比竞争基线效果更好。
  • 其它亮点
    该论文通过调用LLMs生成摘要来确定重要的事件,而无需昂贵的人类注释。实验结果表明,该方法生成的事件图更准确,并超越了竞争基线。论文使用的数据集和开源代码也值得关注。
  • 相关研究
    最近的相关研究包括:《Event Extraction and Representation Learning from Natural Language Text》、《Event Extraction from Text Using Conditional Random Fields》、《A Survey of Event Extraction Methods from Text for Decision Support Systems》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论