因为缺少个体命名的权威机构,所以在语义网上普遍存在着不同数据集用不同名称指代同一个体的现象。当使用多个名称表示同一个体时,我们需要使用 owl:sameAs语句来关联数据,并促进重用。2009年开始就有研究指出使用 owl:sameAs 属性时有时会产生错误。我们之前的工作展示过一张包含超过5亿条明确含有owl:sameAs语句和350亿条暗含owl:sameAs语句的数据图谱(identity graph)。我们提出了一个可扩展的方法,可自动计算每一条语句的错误程度。在本文中,我们生成了整张数据图谱的子图,这些子图都包含一定程度的错误数据。本文结论是尽管语义网中包含了许多错误的owl:sameAs语句,语义网上的数据仍是可用的,同时我们可把因错误使用owl:sameAs语句带来的负面影响降到最低。

内容中包含的图片若涉及版权问题,请及时与我们联系删除