Historical Ink: Semantic Shift Detection for 19th Century Spanish

2024年07月08日
  • 简介
    本文利用计算语言学技术,探讨19世纪西班牙文本中词汇意义的演变,重点关注拉丁美洲西班牙语。文章探讨了语义漂移检测(SSD)任务,这对于理解语言演变,特别是在历史背景下至关重要。该研究集中分析一组西班牙语目标词。为了实现这一目标,构建了一个19世纪的西班牙语语料库,并开发了一个可定制的SSD任务流程。该流程利用经过调整的类BERT模型,分别针对拉丁美洲和普通西班牙语的旧西班牙语文本,帮助找到一个词的不同意义,并测量它们在两个语料库之间的语义变化。结果为我们提供了有关语言变化反映的文化和社会变迁的宝贵见解。
  • 图表
  • 解决问题
    本论文旨在使用计算语言学技术,重点关注拉丁美洲西班牙语,研究19世纪西班牙文本中单词含义的演变,解决语义漂移检测(SSD)任务,以更好地理解语言演变,特别是在历史背景下的语言演变。
  • 关键思路
    论文使用自定义流水线和fine-tuned BERT-like模型,分析19世纪西班牙语语料库中的单词,找到单词的含义,并测量它们在两个语料库之间的语义变化,从而提供有关语言变化反映的文化和社会变化的宝贵见解。
  • 其它亮点
    论文的亮点在于使用计算语言学技术研究历史语言演变,实验设计合理,使用了19世纪西班牙语语料库,开发了自定义流水线和fine-tuned BERT-like模型,提供了有关语言变化反映的文化和社会变化的宝贵见解。
  • 相关研究
    与该论文相关的研究包括:《A Survey of Semantic Change Detection in Historical Text》、《Diachronic Word Embeddings Reveal Statistical Laws of Semantic Change》等。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论