Contextualized Automatic Speech Recognition with Dynamic Vocabulary

2024年05月22日
  • 简介
    本文提出了一种动态词汇表方法,可以在推理阶段添加短语级别的偏置标记,从而消除了学习偏置短语中子词之间依赖关系的需要。每个偏置标记代表一个完整的偏置短语,因此可以应用于各种架构,因为它只扩展了常见的E2E-ASR架构中的嵌入和输出层。实验结果表明,该方法提高了英语和日语数据集上偏置短语的性能。现有的大多数方法将偏置短语视为预定义静态词汇表中子词的序列,这可能导致子词之间的依赖关系学习效果不佳。更先进的技术通过合并额外的文本数据来解决这个问题,但会增加整体工作量。
  • 图表
  • 解决问题
    本文旨在通过提出一种动态词汇表的方法来解决自然语言处理中针对罕见词或上下文短语的深度偏差问题。
  • 关键思路
    本文提出了一种动态词汇表的方法,在推理阶段添加短语级偏差令牌,从而消除了学习偏差短语中子词之间依赖关系的需要。
  • 其它亮点
    本文的方法可以应用于各种体系结构,因为它只扩展了常见的E2E-ASR体系结构中的嵌入和输出层。实验结果表明,该方法提高了英语和日语数据集上的偏差短语的性能。
  • 相关研究
    最近的相关研究包括:1.基于子词的方法(如BPE和WordPiece)来处理罕见词;2.使用外部语料库来增强预定义词汇表的方法;3.使用上下文感知的方法来解决罕见词问题。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论