- 简介口语对话在人工智能交互中起着至关重要的作用,需要对话导向的口语语言模型(SLMs)。为了开发多功能的SLMs,必须有大规模且多样化的语音数据集。此外,为了确保高质量的语音生成,数据必须是自然的,就像野外数据一样,并且必须是去噪的。尽管有这种关键需求,但没有符合所有这些标准的开源语料库可用。本研究通过构建和发布一个名为“日本人工智能对话语料库(J-CHAT)”的大规模口语对话语料库来填补这一空白,并且该语料库是公开可访问的。此外,本文提出了一种语言无关的语料库构建方法,并描述了使用在J-CHAT上训练的SLMs进行对话生成的实验。实验结果表明,使用我们的方法从多个领域收集的数据可以提高对话生成的自然度和意义。
- 图表
- 解决问题构建一个大规模、多样化的口语对话语料库,以促进对话生成技术的发展。
- 关键思路通过语言无关的方法构建了一个名为J-CHAT的大规模日语口语对话语料库,并使用该语料库训练了对话生成模型。
- 其它亮点J-CHAT是一个公开可访问的口语对话语料库,数据来源于多个领域,具有高自然度和高质量。实验结果表明,使用J-CHAT训练的对话生成模型在自然度和意义上都有所提高。
- 近期的相关研究包括英文口语对话语料库的构建和使用,如Switchboard、DailyDialog和Persona-Chat等。
沙发等你来抢
去评论
评论
沙发等你来抢