Improving Event Definition Following For Zero-Shot Event Detection

2024年03月05日
  • 简介
    现有的零样本事件检测方法通常在已知事件类型的数据集上训练模型,并提示其使用未见过的事件定义。这些方法偶尔会取得成功,但通常不能达到预期效果。在这项工作中,我们旨在通过训练模型更好地遵循事件定义来改进零样本事件检测。我们假设多样化的事件类型和定义是模型学习遵循事件定义的关键,而现有的事件提取数据集则侧重于为少数事件类型注释许多高质量的示例。为了验证我们的假设,我们构建了一个自动生成的多样化事件定义(DivED)数据集并进行了比较研究。我们的实验表明,大量的事件类型(200)和多样化的事件定义可以显著提高事件提取性能;另一方面,性能不随每种事件类型超过十个示例而提高。除了扩展性,我们在训练过程中加入事件本体信息和困难负样本,进一步提高了性能。基于这些发现,我们在我们的DivED数据集上对LLaMA-2-7B模型进行了微调,使其在三个零样本事件检测的开放基准测试中的性能超过了像GPT-3.5这样的SOTA大型语言模型。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在通过训练模型更好地遵循事件定义来改进零样本事件检测,并验证了多样化事件定义对模型学习遵循事件定义的重要性。
  • 关键思路
    通过构建自动生成的多样化事件定义(DivED)数据集,训练模型以更好地遵循事件定义,利用事件本体信息和难负样本进一步提高性能,最终在三个开放式基准测试中超过SOTA大型语言模型(如GPT-3.5)。
  • 其它亮点
    论文通过构建自动生成的多样化事件定义(DivED)数据集,验证了多样化事件定义对模型学习遵循事件定义的重要性,并提出了一种基于事件本体信息和难负样本的训练方法,进一步提高了性能。实验结果表明,该方法在三个开放式基准测试中超过了SOTA大型语言模型(如GPT-3.5)。论文还开源了代码和数据集。
  • 相关研究
    最近在这个领域中,还有一些相关研究,如《Zero-shot Event Extraction using Multi-task Learning and Ontology》、《Zero-shot Event Extraction via Transfer Learning and Compositional Generalization》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问