A Language Modeling Approach to Diacritic-Free Hebrew TTS

2024年07月16日
  • 简介
    本文探讨了如何进行希伯来语的文本转语音(TTS)任务。传统的希伯来语中包含有指示如何发音的变音符号,然而现代希伯来语很少使用它们。现代希伯来语中缺少变音符号,因此读者需要根据上下文来推断正确的发音和使用哪些音素,这对于TTS系统来说是一个基本的挑战,需要准确地映射文本到语音。在本文中,我们提出采用一种无变音符号的语言建模方法来进行希伯来语TTS任务。该模型基于离散的语音表示,并以单词片段分词器为条件。我们使用野外弱监督数据来优化所提出的方法,并将其与几种基于变音符号的TTS系统进行比较。结果表明,所提出的方法在内容保留和生成语音的自然程度方面都优于评估基线。可以在以下链接中找到样本:pages.cs.huji.ac.il/adiyoss-lab/HebTTS/。
  • 图表
  • 解决问题
    该论文旨在解决希伯来语文本转语音任务中缺少分音符的问题,提出了一种基于语言建模的无分音符方法。
  • 关键思路
    该论文的关键思路是采用基于离散语音表示的模型,以单词片段分词器为条件,并使用野外弱监督数据进行优化。
  • 其它亮点
    论文通过实验比较了几种基于分音符的TTS系统和提出的无分音符方法,结果表明后者在内容保留和生成语音的自然度方面均优于基线。论文提供了样本和代码。
  • 相关研究
    在这个领域中,有一些相关研究,如:"Investigating the Use of Diacritics for Hebrew Text-to-Speech Synthesis","A Study on Modern Hebrew Text-to-Speech Synthesis"等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论