- 简介我们提出了HebDB,这是一个用于希伯来语口语处理的弱监督数据集。HebDB提供了大约2500小时的自然和自发的希伯来语音记录,包括大量的发言人和主题。我们提供原始记录以及预处理、弱监督和过滤版本。HebDB的目标是进一步增强希伯来语口语处理工具的研究和开发。因此,我们还提供了两个自动语音识别(ASR)的基准系统:(i)一个自我监督模型;和(ii)一个完全监督模型。我们展示了这两种方法在HebDB上的性能,并将它们与当前的多语种ASR替代方案进行比较。结果表明,所提出的方法在考虑相似的模型大小时达到了比评估基线更好的结果。数据集、代码和模型可在https://pages.cs.huji.ac.il/adiyoss-lab/HebDB/上公开获取。
- 图表
- 解决问题解决问题:该论文旨在提供一个针对希伯来语口语处理的弱监督数据集,并提供两种基线模型,以促进该领域的研究和发展。
- 关键思路关键思路:该论文提供了一个名为HebDB的弱监督数据集,其中包含大量自然和自发的希伯来语言音频记录。同时,该论文提供了两种基线模型来进行自动语音识别,包括自监督模型和完全监督模型。
- 其它亮点其他亮点:该论文提供了一个包含大量自然和自发的希伯来语言音频记录的数据集,并提供了两种基线模型来进行自动语音识别。此外,该数据集和代码均已公开,可供研究人员使用。该论文的实验结果表明,所提出的方法在模型大小相似的情况下比当前的多语言ASR替代方案表现更好。
- 相关研究:在该领域最近的相关研究中,还有一些研究正在进行。例如,与多语言ASR相关的研究包括“Multilingual Speech Recognition with a Single End-to-End Model”和“End-to-End Multilingual Speech Recognition with Self-Attention Mechanism”。
沙发等你来抢
去评论
评论
沙发等你来抢