A survey of open-source data quality tools: shedding light on the materialization of data quality dimensions in practice

2024年07月26日
  • 简介
    数据质量(DQ)描述数据特征符合要求并适合人类和/或系统使用的程度。 DQ可以通过多个方面进行衡量,称为DQ维度(即准确性,完整性,一致性等),文献中也称为特征。 ISO / IEC 25012标准定义了一个数据质量模型,其中包括十五个这样的维度,规定了数据产品应满足的要求。在这篇简短的报告中,我们旨在以系统化的方式弥合DQ工具提供的低级功能和高级维度之间的差距,揭示它们之间的多对多关系。为此,我们检查了6个开源DQ工具,并强调提供它们提供的功能和ISO标准定义的DQ维度之间的映射。在适用的情况下,我们还提供有关工具利用的软件工程细节的见解,以解决DQ挑战。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在为数据质量工具和ISO/IEC 25012标准之间的联系建立桥梁,以系统的方式揭示它们之间的多对多关系。
  • 关键思路
    本论文通过研究6个开源DQ工具并强调提供它们所提供的功能与ISO标准定义的DQ维度之间的映射,来解决数据质量的挑战。
  • 其它亮点
    本论文提供了有关DQ工具的详细信息,包括它们如何解决DQ问题以及它们如何与ISO标准中定义的DQ维度相关联。此外,本论文还提供了关于软件工程细节的见解,以解决DQ挑战。论文使用了现有的开源工具,并提供了实验结果。
  • 相关研究
    最近在这个领域中,也有其他相关的研究,如《数据质量工具的比较和综述》、《数据质量维度的比较研究》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问