Phonetic Segmentation of the UCLA Phonetics Lab Archive

简介

语音技术和比较语言学的研究需要获取多样化和易于访问的语音数据。UCLA语音学实验室档案是最早的多语种语音语料库之一，包括314种语言的长格式音频记录和语音转录（Ladefoged等人，2009）。最近，其中的95种语言被与单词级语音转录进行了时间对齐（Li等人，2021）。在此，我们介绍了VoxAngeles，这是一个经过审核的语音转录和UCLA语音学实验室档案的音素级对齐语料库，使用95种语言的CMU重新发布版本作为起点。VoxAngeles还包括来自原始UCLA语料库的单词和音素级分割，以及单词和音素持续时间、元音共振峰和元音f0的语音测量。这个语料库增强了原始数据的可用性，特别是对于定量语音类型学，通过元音固有f0的案例研究进行了证明。我们还讨论了VoxAngeles语料库在跨语言语音学的一般研究和教学以及低资源和多语种语音技术方面的实用性。VoxAngeles可以在CC-BY-NC 4.0许可下免费下载和使用。
图表
解决问题

本论文旨在提供一个多语言语音语料库VoxAngeles，以解决语音技术和比较语言学研究中对多样化和易于获取的语音数据的需求。
关键思路

VoxAngeles语料库包括UCLA Phonetics Lab Archive的经过审核的语音转录和音素级别的对齐，以及原始语料库的单词和音素级别的分割，以及单词和音素持续时间、元音共振峰和元音f0的语音测量。这个语料库可以提高原始数据的可用性，特别是对于量化语音类型学，可以通过元音本征f0的案例研究来展示。
其它亮点

该语料库可以用于跨语言语音学的一般研究和教学，以及低资源和多语言语音技术。该语料库是免费下载和使用的，并在CC-BY-NC 4.0许可下发布。
相关研究

最近的相关研究包括语音识别、语音合成和语音情感识别等方面的研究，如“Multilingual Speech Recognition with a Single End-to-End Model Trained on a Large-Scale Multilingual Corpus”和“Cross-lingual Speaker Adaptation for End-to-End Speech Emotion Recognition”。

Phonetic Segmentation of the UCLA Phonetics Lab Archive

评论