XLORE: 中英文跨语言百科知识图谱是清华大学知识工程实验室基于中英文维基和百度百科,对百科知识进行结构化和跨语言链接构建的多语言知识图谱,XLORE基于对异构百科知识资源的语义化,着重解决语义等价关系规模不足,上下位语义关系存在噪声,语义链接关系大量缺失的问题。

     XLORE系统主要分成三个部分。首先是数据预处理模块,我们从异构百科出发,抽取概念,实例和属性。从不同百科抽取的数据存在大量噪音和冗余,缺少跨语言链接,需要进一步处理。然后是算法模块,包括XLORE系统主要采用的方法,主要包括基于异构网络表示学习的跨语言语义等价关系发现的方法,用于发现更多的跨语言等价实例;基于图模型的跨语言属性对齐方法,用于发现更多跨语言等价属性;基于表示学习的细粒度实体分类算法,用于对游离的实例进行分类,补充实例的语义信息。这些方法可以有效地提高数据的质量。

     XLORE系统目前累计访问次数过亿,覆盖全球53个国家或地区;年响应API调用2000万余次。

     XLORE探索得到了一条构建跨语言知识图谱的有效路径,从数据采集和清洗,多语言知识融合到知识补全,对跨语言知识图谱构建中涉及的关键技术都做了深入研究,具体包括知识概念体系建模、跨语言知识融合和跨语言表示学习等,为从大数据向知识转化的知识引擎构建提供了理论技术支撑。我们目前重点处理了中文知识匮乏的问题,与DBpedia相比,中文实体数量是其3.6倍,中英文跨语言链接的数量增加39%。

     此外XLORE还提供多样化的数据API服务,支持概念,实体,属性检索,实体关系预测等丰富的应用。利用XLORE中丰富的跨语言链接,我们研发了无监督跨语言实体链接系统XLink,给定任意文本,系统识别文本中的实体并将其链接到XLORE中,建立了文本到知识图谱之间的桥梁,为文本理解提供了丰富的背景知识。系统累计访问次数过亿,覆盖全球53个国家或地区;2018年响应API调用160万余次,覆盖全国113个主要城市。XLORE将作为知识资源,为基于知识的机器智能服务提供强有力的支撑,推动以知识为核心的机器智能技术的创新研究。

     XLORE将作为知识资源,为基于知识的机器智能服务提供强有力的支撑,推动以知识为核心的机器智能技术的创新研究。

 

 

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除