Adapting the NICT-JLE Corpus for Disfluency Detection Models

解决问题:本论文旨在解决学习者语音中的语调、重复和错误开始等不流畅因素的检测问题。与Switchboard语料库相比,学习者语音数据集的获取和使用存在限制,因此本文描述了如何将NICT-JLE语料库适应于不流畅检测模型的训练和评估。

关键思路:本文的关键思路是将NICT-JLE语料库转换为适合于训练和评估不流畅检测模型的格式。本文详细介绍了NICT-JLE和Switchboard语料库之间的差异,并对NICT-JLE语料库的标签集和元特征进行了适应性修改。这项工作的结果为未来在学习者语音的不流畅检测研究中提供了标准的训练、测试和验证集。

其他亮点:本文的亮点在于提供了一个新的数据集,可以用于学习者语音的不流畅检测研究。本文使用了300小时的英语学习者口语测试数据集,并对其进行了适应性修改。本文未提及开源代码和其他值得深入研究的工作。

关于作者:Lucy Skidmore和Roger K. Moore是本文的主要作者,他们分别来自英国萨里大学和谢菲尔德大学。Skidmore的代表作包括“An Investigation into the Use of Prosodic Features for Disfluency Detection”,Moore的代表作包括“An Investigation into the Role of Prosody in the Detection of Disfluency”。

相关研究:近期其他相关的研究包括“Disfluency Detection in Children's Speech Using Convolutional Neural Networks”(作者:N. M. Alotaibi,机构:皇家霍洛威学院)和“Disfluency Detection in Spontaneous Speech Using Deep Bidirectional LSTM Networks”(作者:S. K. Kopparapu等,机构:印度理工学院)。

论文摘要:本文介绍了将包含约300小时英语学习者口语水平测试的NICT-JLE语料库适应为适合于训练和评估语言学习者语音中的表达迟疑、重复和虚假开始等不流畅现象的模型的格式。与Switchboard语料库相比,NICT-JLE语料库具有不同之处,其中包括许多限制访问政策,这使得比较和随后改进模型更具挑战性。本文探讨了NICT-JLE语料库与Switchboard语料库之间的差异,并详细介绍了对NICT-JLE语料库的标记集和元特征的改进。本文的结果为未来有关语言学习者不流畅检测的研究提供了标准化的训练、保留和测试集。

内容中包含的图片若涉及版权问题,请及时与我们联系删除