- 简介数据增强是一系列技术,通过操纵现有的数据样本生成高质量的人工数据。通过利用数据增强技术,AI模型可以在涉及稀缺或不平衡数据集的任务中实现显著改进的适用性,从而大大提高AI模型的泛化能力。现有的文献调查仅关注于某种特定形式的数据,并从形态特异性和操作中心的角度对这些方法进行分类,缺乏跨多种形态的数据增强方法的一致总结,并且限制了现有数据样本如何服务于数据增强过程的理解。为了弥补这一差距,我们提出了一个更具启发性的分类法,涵盖了不同常见数据形态的数据增强技术。具体来说,从数据中心的角度出发,本调查提出了一种形态无关的分类法,通过研究如何利用数据样本之间的内在关系,包括单样本、对样本和群体样本数据增强方法。此外,我们通过统一的归纳方法将数据增强方法分为五种数据形态。
- 图表
- 解决问题本篇论文旨在提出一种更全面的数据增强方法分类法,以便更好地理解现有数据增强技术,从而提高人工智能模型的泛化能力。
- 关键思路论文提出了一种基于数据的分类法,将数据增强技术分为三种类型:单样本、对样本和群体样本,并通过归纳方法将数据增强方法分为五种数据模态。
- 其它亮点论文提出了一种更全面的数据增强方法分类法,覆盖了多种数据模态,并提出了三种不同类型的数据增强方法。此外,论文还介绍了各种数据增强方法的具体实现,并在多个数据集上进行了实验验证。
- 在最近的相关研究中,也有一些关于数据增强方法的分类研究。例如,“A Survey on Data Augmentation for Imbalanced Datasets”和“Data Augmentation Techniques for Deep Learning: A Survey”等。
沙发等你来抢
去评论
评论
沙发等你来抢