标题:蒙特利尔大学、LIA-阿维尼翁大学、俄亥俄州立大学等|SpeechBrain: A General-Purpose Speech Toolkit(SpeechBrain:通用语音工具包)

简介:SpeechBrain 是一个开源的一体化语音工具包。 它旨在促进神经语音处理技术的研发

简单、灵活、用户友好且文档齐全。 这篇论文描述了旨在支持多个共同感兴趣的任务的核心架构,允许用户自然地构思、比较和分享新颖的语音处理流水线。SpeechBrain 在广泛的范围内实现了具有竞争力或最先进的性能的语音基准。 它还提供训练配方、预训练模型和流行语音数据集的推理脚本,以及允许任何人的教程具有基本的 Python 能力以熟悉语音技术。

代码下载:https://github.com/speechbrain/speechbrain

论文下载:https://arxiv.org/pdf/2106.04624.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除