CMNEE: A Large-Scale Document-Level Event Extraction Dataset based on Open-Source Chinese Military News

2024年04月18日
  • 简介
    从军事文本中提取结构化事件知识,包括事件触发器和相应的参数,对于许多应用程序,如情报分析和决策支持至关重要。然而,军事领域中的事件提取面临数据稀缺问题,这阻碍了该领域事件提取模型的研究。为了缓解这个问题,我们提出了CMNEE,一个大规模的、文档级别的、开源的中国军事新闻事件提取数据集。它包含17,000个文档和29,223个事件,这些事件都是基于预定义的军事领域模式进行手动注释的,包括8种事件类型和11种参数角色类型。我们设计了一个两阶段、多轮注释策略,以确保CMNEE的质量,并使用系统评估重现了几个最先进的事件提取模型。在CMNEE上的实验结果显然比其他领域数据集上的结果差,这表明军事领域的事件提取面临独特的挑战,需要进一步的研究努力。我们的代码和数据可以从https://github.com/Mzzzhu/CMNEE获取。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决军事领域事件抽取中的数据稀缺问题,提出了一个大规模的中文军事新闻事件抽取数据集CMNEE,并探索了军事领域事件抽取的挑战和研究方向。
  • 关键思路
    论文提出了一种两阶段、多轮次的标注策略,基于预定义的军事领域事件抽取模式,手动标注了17,000个文档和29,223个事件,包括8个事件类型和11个参数角色类型。同时,使用系统评估复现了几个最先进的事件抽取模型。
  • 其它亮点
    CMNEE是一个大规模、文档级别的中文军事新闻事件抽取数据集,包含了丰富的事件类型和参数角色类型,并提出了一种有效的标注策略。论文提出的事件抽取模型在CMNEE上的表现不如在其他领域数据集上的表现,说明军事领域事件抽取具有独特的挑战和研究价值。
  • 相关研究
    最近的相关研究主要集中在事件抽取领域,如Yuan等人的《A Joint Event Extraction and Coreference Resolution Model with Contextualized Span Representations》和Zhang等人的《Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问