To Drop or Not to Drop? Predicting Argument Ellipsis Judgments: A Case Study in Japanese

2024年04月17日
  • 简介
    演讲者有时会在句子中省略谓词的某些参数;这种省略在代词省略语言中特别频繁。本研究探讨了一个关于省略的问题——什么可以解释本土说话者的省略决策?——这是出于对人类话语处理和写作辅助的兴趣。为此,我们首先收集了日语平衡语料库中超过2,000个数据点上是否以及为什么应该省略特定参数的大规模人类注释。数据表明,本土说话者总体上分享这些判断的共同标准,并进一步阐明了它们的定量特征,例如平衡语料库中相关语言因素的分布。此外,我们还检查了基于语言模型的参数省略判断模型的表现,并揭示了系统在特定语言方面预测与人类判断之间的差距。我们希望我们的基础资源能够鼓励进一步研究自然人省略判断。
  • 图表
  • 解决问题
    本论文旨在解决一个关于省略现象的问题,即母语使用者省略谓语的某些论元时的决策背后的原因是什么?同时,该论文也试图提供写作辅助工具来帮助人们做出省略决策。这是一个相对新的问题。
  • 关键思路
    论文通过收集大规模的人类注释数据,探讨了日语等省略现象较为普遍的语言中,母语使用者省略谓语论元的决策标准,并进一步阐明了这些标准的定量特征。同时,论文还建立了基于语言模型的省略判断模型,并揭示了该系统在特定语言方面预测与人类判断之间的差距。
  • 其它亮点
    论文的亮点包括:通过大规模人类注释数据,揭示了省略决策的标准和定量特征;建立了基于语言模型的省略判断模型;探讨了该模型在特定语言方面的局限性。实验使用了日语平衡语料库,并提供了开源代码,为后续研究提供了基础资源。
  • 相关研究
    在这个领域的相关研究包括:《A Multi-Task Learning Approach for Predicting Implicit Discourse Relations》、《A Corpus of Non-canonical Left-Dislocated Constructions in Spoken Japanese》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论