- 简介我们呈现了ZAEBUC-Spoken,这是一个多语种多方言的阿拉伯语-英语语音语料库。该语料库包含十二小时的Zoom会议,涉及多个发言人在角色扮演工作情境中,学生们为某个主题进行头脑风暴,并与交际者讨论。会议涵盖不同的主题,分为不同的语言设置阶段。该语料库对于自动语音识别(ASR)提出了挑战,包括两种语言(阿拉伯语和英语),阿拉伯语以多种变体(现代标准阿拉伯语、海湾阿拉伯语和埃及阿拉伯语)的形式出现,英语则带有各种口音。除了这些语言和方言之间的代码切换,语料库的复杂性还在于它。作为我们工作的一部分,我们从已有的转录指南中汲取灵感,提出了一组处理会话语音、代码切换和两种语言的正字法问题的指南。我们进一步丰富了语料库,增加了两层注释;(1)方言等级注释,适用于混合不同阿拉伯语变体的语料库部分,(2)自动形态注释,包括分词、词形还原和词性标注。
- 图表
- 解决问题这篇论文旨在解决多语言和多方言语音识别的问题,其中包括阿拉伯语和英语的多种变体和口音,并且还涉及这些语言和方言之间的混合使用。
- 关键思路论文提出了一个新的多语言、多方言语音语料库,并且使用两个层次的注释来丰富这个语料库,以便更好地处理混合使用的情况。其中,第一层是方言水平注释,第二层是自动形态注释。
- 其它亮点这个语料库包含了12小时的Zoom会议录音,讨论了不同的主题,并且涉及到不同的语言和方言,包括现代标准阿拉伯语、海湾阿拉伯语和埃及阿拉伯语,以及英语的不同口音。此外,还有这些语言和方言之间的混合使用。论文还提供了一套处理对话语音、语言混合和正字法的指南。实验使用了自己构建的语料库,并且进行了自动语音识别的实验。
- 在这个领域中,最近的相关研究包括《Multilingual and Code-Switching Speech Recognition》、《Code-switching in multilingual speech recognition: A survey》等。
沙发等你来抢
去评论
评论
沙发等你来抢