Growing Trees on Sounds: Assessing Strategies for End-to-End Dependency Parsing of Speech

2024年06月18日
  • 简介
    最近提出了一项任务——直接依赖语音信号进行分析,而不是分析语音转录(Pupier等人,2022年),这是一种将韵律信息纳入分析系统并绕过使用自动语音识别(ASR)系统和句法分析器的管道方法的方式。本文报告了一系列实验,旨在评估两种分析范式(基于图的分析和基于序列标记的分析)在语音分析中的性能。我们在一个大型的、包含真实自然对话的法语口语语料库上进行了评估。我们的研究结果表明,(i)基于图的方法在各方面都获得了更好的结果;(ii)直接从语音中进行分析的表现优于管道方法,尽管参数少了30%。
  • 图表
  • 解决问题
    本文旨在评估两种语音解析范式(基于图的解析和基于序列标记的解析)在大规模口语树库上的性能,以解决语音解析中的限制和挑战。
  • 关键思路
    本文提出了一种直接从语音信号中进行依赖分析的方法,以绕过语音转录的限制,同时利用韵律信息提高解析准确性。实验结果表明,基于图的方法在所有测试指标上均优于基于序列标记的方法,并且直接从语音信号进行解析比使用流水线方法(ASR + 句法分析器)具有更好的性能。
  • 其它亮点
    本文使用大规模的口语法国树库进行实验,证明了直接从语音信号进行解析的可行性和优越性。实验结果表明,基于图的方法在所有测试指标上均优于基于序列标记的方法,并且直接从语音信号进行解析比使用流水线方法(ASR + 句法分析器)具有更好的性能。
  • 相关研究
    最近在该领域中,也有一些相关研究,例如Pupier等人的工作,提出了直接从语音信号中进行依赖分析的任务。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论