对话式检索近年来成为了信息检索中的研究热点,但是该研究领域一直存在数据资源缺乏的问题,一方面没有现有的对话式检索系统收集真实场景的数据,另一方面用户实验模拟产生的数据集规模不足以支撑深度学习模型的训练,本文首先讲介绍以下两种数据集:用户实验数据集:通过人来扮演 machine agent,从而研究对话式检索的特点;单一任务数据集:规模较大、但是只能完成对话式检索中一个子任务的数据集。最后我们将介绍今年 SIGIR 上提出的第一个可以完整训练对话式检索整个流程的数据集 WISE。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢