Advancing Speech Translation: A Corpus of Mandarin-English Conversational Telephone Speech

2024年03月25日
  • 简介
    本文介绍了一组英文翻译,用于处理CallHome普通话数据和HKUST普通话电话语音数据的123小时子集,以进行语音翻译任务。对于训练端到端的语音翻译系统以及级联系统,成对的源语言语音和目标语言文本是必不可少的,并且相对于在更广泛可用的文本数据集上进行训练,可以提供大幅度的性能改进。我们证明,将通用翻译模型微调到我们的普通话-英语会话电话语音训练集可以将目标领域的BLEU提高8个多点,突显了匹配的训练数据的重要性。
  • 图表
  • 解决问题
    本论文旨在为语音翻译任务提供一组英文翻译,针对CallHome和HKUST两个普通话电话语音数据集的123小时子集进行研究。研究表明,配对的源语言语音和目标语言文本对于训练端到端语音翻译系统至关重要,并且相对于在更广泛可用的文本数据集上训练,可以为级联系统提供实质性的性能提升。
  • 关键思路
    本论文的关键思路是使用配对的源语言语音和目标语言文本来训练端到端语音翻译系统,从而提高翻译质量。同时,通过将通用翻译模型微调到普通话-英语电话语音训练集,可以进一步提高目标领域的BLEU分数。
  • 其它亮点
    论文使用了CallHome和HKUST两个普通话电话语音数据集的123小时子集进行研究,并提供了英文翻译。实验结果表明,使用配对的源语言语音和目标语言文本训练的端到端语音翻译系统可以提高翻译质量。同时,将通用翻译模型微调到普通话-英语电话语音训练集,可以进一步提高目标领域的BLEU分数。论文提供了开源代码,可以为后续研究提供参考。
  • 相关研究
    最近在这个领域中,也有一些相关的研究,如“End-to-End Mandarin-English Code-Switching Speech Translation with Dynamic Chunking”和“Improving End-to-End Speech Translation with Task-Aware Decoding and Noise Adaptive Training”。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问