The Development of a Comprehensive Spanish Dictionary for Phonetic and Lexical Tagging in Socio-phonetic Research (ESPADA)

简介

发音字典是语音强制对齐过程中的重要组成部分。这些字典的准确性对齐后的语音数据具有很强的影响，因为它们有助于将正字法转录和声学信号之间进行映射。本文介绍了创建一个全面的西班牙语发音字典（ESPADA）的过程，可用于西班牙语数据的大多数方言变体。目前的字典侧重于特定的地区变体，但是由于我们工具的灵活性，它可以轻松地应用于捕捉主要方言变体之间最常见的语音差异。我们提出了改进当前发音字典的建议，以及映射其他相关注释，如形态和词汇信息。在大小方面，它是目前最完整的字典，包含来自16个国家的超过628,000个词条，每个词条都附带其相应的发音、形态和词汇标记以及其他有关语音分析的相关信息：重音模式、音位结构、IPA转录等。这旨在为社会语音研究人员提供一个完整的开源工具，以增强西班牙语言的社会语音框架内的方言研究。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本文旨在创建一个全面的西班牙语发音词典（ESPADA），以解决现有发音词典只关注特定方言变体的问题，从而提高西班牙语言学研究的质量和效率。
关键思路

本文提出了创建一个全面的西班牙语发音词典的方案，并结合词形、词汇信息等其他注释进行了改进，使其具有更好的适用性和准确性。
其它亮点

该词典包含超过628,000个词条，涵盖了16个国家的单词，每个词条都有对应的发音、词形和词汇标记，以及其他有助于音韵分析的信息，如重音模式、音位结构和IPA转录等。该词典是开源的，可以为社会音韵学研究提供完整的工具。
相关研究

最近的相关研究包括：1.《西班牙语发音词典的构建和应用》；2.《基于深度学习的西班牙语语音识别》；3.《西班牙语方言变体的音韵研究》等。

The Development of a Comprehensive Spanish Dictionary for Phonetic and Lexical Tagging in Socio-phonetic Research (ESPADA)

提问交流

提问交流