RAAMove: A Corpus for Analyzing Moves in Research Article Abstracts

2024年03月23日
  • 简介
    这篇论文介绍了RAAMove,一个专门用于研究论文摘要中移动结构的全面多领域语料库,其主要目的是便于移动分析和自动移动识别。本文提供了语料库建设过程的详细讨论,包括方案、数据收集、注释指南和注释程序。语料库分两个阶段构建:首先,专家注释员手动注释高质量数据;随后,基于人工注释数据,采用基于BERT的模型进行自动注释,并在专家的修改下完成。结果是一个大规模高质量的语料库,包括33,988个注释实例。我们还使用基于BERT的模型进行了初步的移动识别实验,以验证所提出的语料库和模型的有效性。注释语料库可供学术研究目的使用,并可作为移动分析、英语教学和写作以及自然语言处理中与移动/话语相关的任务的重要资源。
  • 图表
  • 解决问题
    本论文旨在构建一个专门用于研究论文摘要中的移动结构的语料库,以便于进行移动分析和自动移动识别。
  • 关键思路
    本文提出了RAAMove,一个多领域的语料库,通过两个阶段的构建,利用专家注释和BERT模型实现了高质量的移动结构自动标注,共包含33,988个标注实例。
  • 其它亮点
    本文详细介绍了语料库的构建过程,包括方案、数据收集、注释指南和注释过程,同时使用BERT模型进行了移动结构自动标注实验,并公开了语料库,可供学术研究和自然语言处理相关任务使用。
  • 相关研究
    最近的相关研究主要集中在英语特定目的和学术目的语言的移动结构研究上,但是针对研究论文摘要的移动结构注释语料库仍然较少。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论