- 简介基于预训练语言模型(PLMs),事件共指消解(ECR)系统在跨文档聚类共指事件方面表现出色。然而,现有系统在输入提及对文本中过度依赖“触发词词汇匹配”的虚假模式。我们使用结构因果模型(SCM)规范基线ECR系统的决策过程,旨在识别ECR任务中的虚假和因果关联(即原理)。利用反事实数据增强的去偏置能力,我们开发了一种基于原理的反事实数据增强方法,其中LLM在其中。该方法专门针对ECR系统中的成对输入,在触发器和上下文上进行直接干预,以减轻虚假关联并强调因果关系。我们的方法在三个流行的跨文档ECR基准测试中实现了最先进的性能,并在域外场景中展示了鲁棒性。
-
- 图表
- 解决问题本论文旨在解决事件共指消解系统中过度依赖触发词词汇匹配的问题,提出了一种基于因果关系的反事实数据增强方法。
- 关键思路本文提出了一种基于因果关系的反事实数据增强方法,通过直接干预触发词和上下文,减轻了系统中的虚假关联并强调因果关系。
- 其它亮点本文的方法在三个跨文档事件共指消解基准测试中取得了最先进的性能,并在域外场景中展现了鲁棒性。实验使用了结构因果模型和LLM-in-the-loop技术,并开源了代码。
- 最近的相关研究包括:《End-to-End Neural Coreference Resolution for Coherent Text Processing》、《Multi-Level Matching and Aggregation Network for Few-Shot Relation Classification》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流