Data augmentation with automated machine learning: approaches and performance comparison with classical data augmentation methods

简介

数据增强是常用的正则化技术，可提高机器学习模型的泛化性能，被认为是最重要的技术之一。它主要涉及应用适当的数据转换操作来创建具有所需属性的新数据样本。尽管其有效性，但该过程通常具有挑战性，因为需要手动创建和测试不同的候选增强和其超参数，这是一个耗时的试错过程。自动数据增强方法旨在自动化该过程。最先进的方法通常依赖于自动机器学习（AutoML）原则。本文对基于AutoML的数据增强技术进行了全面调查。我们讨论了各种实现AutoML数据增强的方法，包括数据操作、数据集成和数据合成技术。我们详细讨论了实现数据增强过程的每个主要子任务的技术：搜索空间设计、超参数优化和模型评估。最后，我们对自动数据增强技术和基于传统增强方法的最先进方法的性能进行了广泛的比较和分析。结果表明，目前用于数据增强的AutoML方法优于基于传统方法的最先进技术。

作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~

图表

解决问题

自动化数据增强技术的综述和比较

关键思路

使用自动机器学习技术实现数据增强，包括数据操作、数据集成和数据合成等技术，解决手动试错过程耗时的问题。

其它亮点

论文详细讨论了数据增强过程中的搜索空间设计、超参数优化和模型评估等子任务的技术，通过对比实验发现，基于自动机器学习技术的数据增强方法优于传统的方法。

Data augmentation with automated machine learning: approaches and performance comparison with classical data augmentation methods

提问交流

提问交流