【论文标题】LSOIE: A Large-Scale Dataset for Supervised Open Information Extraction 【作者团队】Jacob Solawetz, Stefan Larson 【发表时间】2020/01/27 【机 构】Roboflow&Rose Gold AI 【论文链接】https://arxiv.org/abs/2101.11177

【推荐理由】 本文提供了一个新的开放信息抽取的公开数据集。 开放信息提取(OIE)系统试图将一个句子的事实命题压缩为一系列n元元组。 这些元组对于自然语言处理中的下游任务很有用,例如知识库创建,文本蕴涵和自然语言理解。 但是,当前的OIE数据集在大小和多样性上都受到限制。 通过将QA-SRL 2.0数据集转换为大规模OIE数据集(LSOIE),本文引入了一个新的数据集。 本文的LSOIE数据集比第二大的人工注释OIE数据集大20倍。 作者在LSOIE上构建和评估了几个基准OIE模型,为将来对该任务的改进提供了基准。 本文的LSOIE数据,模型和代码已公开提供。

内容中包含的图片若涉及版权问题,请及时与我们联系删除