本体schema是知识图谱构建中的重要一环,而本体的层级is-a体系是schema的一个核心。如果有一个涵盖父子类层级关系知识库,对于schema辅助构建、基于图谱的上下位推理、事件抽象具有重要意义。

YAGO、wordnet、wiki-taxonomy等都是面向英文的概念知识图谱,近年来,也陆续出现了中文的概念图谱资源,其中CN-probase和大词林实体类型知识库是两个典型代表,前者以百科词条义项和标签等信息作为上下位概念数据来源进行构建,后者借助搜索引擎和启发式规则进行概念对识别,并借助同义词词林作为上下位层次骨架进行组织,均实现了数千万级的规模。

本文主要围绕知识图谱技术中的概念层级关系获取,从大词林、CN-probase两个代表性工作出发,对其构建细节相关技术进行介绍。

内容中包含的图片若涉及版权问题,请及时与我们联系删除