机器阅读理解(Machine Reading Comprehension)是指让机器阅读文本,然后回答和阅读内容相关的问题。作为自然语言处理领域(Natural Language Processing,后文简称NLP)的前沿课题,机器阅读理解近年来受到学术界和工业界的广泛关注。
从学术角度看,机器阅读理解任务可以用来衡量机器理解人类语言的综合水平。NLP的很多传统任务,例如词性标注、命名实体识别、句法分析、语义角色标注、指代消解等都试图让机器从词法、语义等角度理解人类语言。机器在某一个任务上的效果,仅在一定程度上反应了机器在该方面对语言的理解水平。而在阅读理解任务中,机器需要在词法、语义等多方面有较高的理解水平,才能够正确回答相关问题。因此可以通过让机器阅读文本回答相关问题,来评价机器理解人类语言的综合水平。这与人类参加的语言考试中用阅读理解题目考察答题者对语言和内容的理解水平是类似的。
从应用角度看,机器阅读理解也是构建问答系统和对话系统的关键技术之一。近些年来,各种智能设备,如智能手机、智能音响等迅速普及。这些设备具有小屏化或无屏化的特点,因此用户亟需能够精准满足其信息需求的问答技术。传统的检索式问答技术,主要关注段落排序,仍难以完成精准问答的“最后一公里”,即段落中的精准答案定位。而近两年机器阅读理解技术所取得的进展,为精准答案定位提供了有力的技术支持。百度也将机器阅读理解技术应用在了搜索问答和小度音箱中,为数亿用户提供精准问答。
近几年,机器阅读理解方向所取得的进展,主要得益于各种大规模阅读理解数据集的出现,以及基于神经网络的阅读理解技术的快速进步。接下来本文会从这两方面来回顾阅读理解方向近几年的进展、局限和可能的发展方向。
感兴趣的可以继续戳原文。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢