Historical Ink: Semantic Shift Detection for 19th Century Spanish

2024年07月08日
  • 简介
    本文使用计算语言学技术,重点关注拉丁美洲西班牙语,探讨19世纪西班牙语文本中词汇含义的演变。它涉及语义漂移检测(SSD)任务,这对于理解语言演变尤其是在历史背景下非常重要。该研究侧重于分析一组西班牙语目标词。为了实现这一目标,构建了一个19世纪的西班牙语语料库,并开发了一个可定制的SSD任务流程。该流程有助于找到一个词的意义,并使用针对拉丁美洲和通用西班牙语的旧西班牙语文本进行微调的BERT-like模型来衡量它们在两个语料库之间的语义变化。结果为我们提供了有关随时间语言变化中反映的文化和社会变化的有价值的见解。
  • 图表
  • 解决问题
    本文试图使用计算语言学技术探究19世纪西班牙文本中词义的演变,特别是拉丁美洲西班牙语。主要解决Semantic Shift Detection(SSD)任务,以了解语言演变,特别是在历史背景下的演变。
  • 关键思路
    本文构建了一个19世纪西班牙语语料库,并开发了一个可定制的SSD任务流程。使用经过微调的类BERT模型和旧西班牙语文本,对西班牙语目标词的意义进行分析,并测量它们在两个语料库之间的语义变化。这种方法可以提供有关语言变化反映的文化和社会变化的有价值的见解。
  • 其它亮点
    本文的亮点在于使用计算语言学技术探究西班牙语词义演变,特别是在历史背景下的演变。实验使用了19世纪的西班牙语语料库,并开发了一个可定制的SSD任务流程。使用类BERT模型进行分析,并测量词义的语义变化。本文的研究结果提供了有关文化和社会变化反映在语言变化中的有价值的见解。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,例如:'Word Sense Disambiguation and Semantic Shift Detection with Adversarial Training','Unsupervised Semantic Change Detection in Historical Text','Measuring Semantic Change and Variation in Historical Corpora'等。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论