由于包含知识标注的多轮对话数据集的缺乏,知识驱动对话系统的研究在很大程度上受到了限制。为了进一步推动多领域的知识驱动的多轮对话研究并且弥补中文语料的缺乏,该项目提出了一个中文的多领域的知识驱动的对话数据集KdConv(Knowledge-driven Conversation),其使用知识图谱为多轮对话中使用的知识进行标注。该语料库包含了来自三个领域(电影、音乐和旅游)的4.5K个对话,86K个句子,平均轮数为19.0。这些对话包含了相关话题的深度讨论,以及多个话题之间的自然过渡。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢