Review for Handling Missing Data with special missing mechanism

2024年04月07日
  • 简介
    缺失数据在数据科学中是一个重要的挑战,会影响决策过程和结果。了解什么是缺失数据,它是如何发生的,以及为什么必须适当处理它在处理现实世界数据时至关重要,特别是在表格数据中,这是现实世界中最常用的数据类型之一。文献中定义了三种缺失机制:完全随机缺失(MCAR)、随机缺失(MAR)和非随机缺失(MNAR),每种机制在插补中都会带来独特的挑战。大部分现有工作都集中在相对容易处理的MCAR上。MNAR和MAR的特殊缺失机制尚未得到深入探究和理解。本文回顾了现有文献中处理缺失值的方法,比较和对比了现有方法在处理不同缺失机制和数据类型方面的能力。它还确定了现有文献中的研究空白,并为未来研究提出了潜在方向。本次综述的信息将帮助数据分析师和研究人员在处理现实世界问题中采用和推广处理缺失数据的良好实践。
  • 图表
  • 解决问题
    处理缺失数据是数据科学中的一个重要问题,本论文旨在比较和对比现有的处理缺失值的方法,包括针对不同缺失机制和数据类型的处理方法,并指出现有文献中的研究空白和未来研究方向。
  • 关键思路
    本文综述了现有的处理缺失值的方法,包括删除、插补和模型方法,并探讨了它们在不同缺失机制和数据类型下的适用性。此外,本文提出了未来研究方向,包括改进现有方法、开发新方法以及探索深度学习在处理缺失数据方面的应用。
  • 其它亮点
    本文提出了一个综合的框架,用于比较和对比现有的处理缺失值的方法。实验结果表明,不同的方法在不同的缺失机制和数据类型下表现不同。此外,本文还讨论了深度学习在处理缺失数据方面的应用潜力,并提出了未来研究方向。
  • 相关研究
    最近的相关研究包括:1. "A review of imputation methods for missing data in educational research";2. "A comparative study of imputation methods for missing data in predictive modeling";3. "Missing data imputation using deep learning techniques"。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论