A Comprehensive Rubric for Annotating Pathological Speech

2024年04月29日
  • 简介
    本研究介绍了一种综合性的评分标准,基于语音质量的不同维度(包括语音学、流畅度和韵律),用于标记唐氏综合症患者的语音语料库,以建立标准化的标准来识别其语音中的错误,从而实现自动化评估系统的开发。为了达到这个目标,我们利用了Prautocal语料库。为了评估使用我们的评分标准的注释质量,我们进行了两个实验,分别关注语音学和流畅度。对于语音学评估,我们采用了发音好坏度量(GoP)指标,利用自动分割系统,并将结果与专业语音治疗师进行的评估进行相关性分析。虽然所得到的相关值并不是非常高,但观察到了积极的趋势。在流畅度评估方面,我们使用了像wav2vec这样的深度学习模型来提取音频特征,并使用在识别流畅度问题方面的语料库上训练的SVM分类器对Prautocal语料库样本进行分类。结果突出了评估此类现象的复杂性,这取决于检测到的具体不流畅类型的变异性。
  • 图表
  • 解决问题
    本文旨在建立一个基于多个语音质量维度的综合评估标准,以标准化识别唐氏综合症患者的语音错误,从而促进自动化评估系统的开发。
  • 关键思路
    本文提出了一个包括语音学、流畅性和韵律等多个维度的综合评估标准,并运用自动化分割系统和深度学习模型进行实验验证。
  • 其它亮点
    本文使用了Prautocal语音库进行评估,并使用Goodness of Pronunciation (GoP)度量和SVM分类器进行实验。实验结果表明,该评估标准具有一定的可行性,但是评估语音流畅性的复杂性需要进一步研究。
  • 相关研究
    最近的相关研究包括:1. "Automatic Speech Recognition for Down Syndrome: A Review";2. "Speech Analysis of Down Syndrome Adults: A Review";3. "Speech and Language Characteristics of Children with Down Syndrome"。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论