实体摘要(Entity Summarization),是知识图谱研究与应用中的一个关键问题。南京大学Websoft团队为此制作了一个评测集,称作ESBM,是目前可以公开获取的规模最大的评测集。这项工作被知识图谱领域重要国际会议ESWC 2020(CCF-C类)授予“最佳资源论文提名奖”。以下是论文第一作者博士生刘庆霞对这项工作的介绍。
RDF数据集,如知识图谱,采用大量三元组描述实体。实体摘要的任务,就是从描述给定实体的大量三元组中,选出一个满足容量限制的最优子集作为实体的摘要。研究领域对该问题提出了多种求解方法,然而这些方法之间缺乏统一的比较。原因之一在于缺乏高质量的评测集。为此,我们构建并发布了评测集ESBM,其是目前实体摘要领域公开发布的规模最大的评测集。此外,基于ESBM,我们实验评测了9个现有实体摘要方法,以及基于监督学习的实体摘要方法。
本文介绍了ESBM评测集的构造、分析和相关评测实验的主要内容,更多详细内容,欢迎阅读我们发表在ESWC 2020的研究论文:
Qingxia Liu, Gong Cheng, Kalpa Gunaratna, Yuzhong Qu: ESBM: An Entity Summarization BenchMark. ESWC 2020: 548-564
该评测集的相关数据和代码已在GitHub公开发布:https://github.com/nju-websoft/ESBM
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢