FFSTC: Fongbe to French Speech Translation Corpus

2024年03月08日
  • 简介
    本文首次介绍了Fongbe到法语的语音翻译语料库(FFSTC)。该语料库包含约31小时的Fongbe语言内容,包括法语转录和相应的Fongbe语音记录。FFSTC是通过各种收集方法和专业人员的努力编制而成的全面数据集。此外,我们使用Fairseq的transformer_s和conformer模型进行基线实验,以评估数据质量和有效性。我们的结果表明,transformer_s模型得分为8.96,conformer模型得分为8.14,为FFSTC语料库建立了基线。
  • 作者讲解
  • 图表
  • 解决问题
    本文介绍了Fongbe到法语的语音翻译语料库(FFSTC),并进行了基线实验评估数据质量和有效性。
  • 关键思路
    本文提出了一个新的语音翻译语料库,使用Fairseq的transformer_s和conformer模型进行基线实验。
  • 其它亮点
    语料库包括Fongbe语言内容的31小时录音和法语转录,使用多种收集方法和专注个人的努力编制而成。实验结果为transformer_s模型8.96分,conformer模型8.14分,为FFSTC语料库建立了基线。
  • 相关研究
    最近的相关研究包括:End-to-End Speech Translation with Knowledge Distillation, Speech Translation with Fine-Grained Attention, Neural Machine Translation for Low-Resource Languages using Bilingual Corpora and Synthetic Data等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问