标题:谷歌、华盛顿大学|TIMEDIAL: Temporal Commonsense Reasoning in Dialog(TIMEDIAL:对话中的时间常识推理)

简介:日常对话需要理解日常事件,而这反过来又需要理解与这些事件交织在一起的时间常识概念。尽管最近在 T5 和 GPT-3 等大规模预训练语言模型方面取得了进展,但它们在对话中的时间推理能力在很大程度上仍未得到充分探索。在本文中,我们通过引入一项新任务和一个众包英语挑战集 TIMEDIAL,展示了第一个研究预训练语言模型的时间推理能力 indialogs。我们将 TIME-DIAL 制定为一项多项选择完形填空任务,其中包含超过 1.1K 精心策划的对话。实证结果表明,与人类相比,即使是表现最好的模型也难以完成这项任务,准确度有 23 个绝对点的差距。此外,我们的分析表明,模型未能正确推理对话上下文;相反,他们依赖于基于上下文中现有时间模式的浅层线索,激励未来的研究对文本中的时间概念进行建模以及对它们进行稳健的上下文推理。

数据集:https://github.com/google-research-datasets/timedial

论文下载:https://arxiv.org/pdf/2106.04571v1.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除