- 简介人类食入或吸入微塑料颗粒已成为一个日益引起关注的问题。不幸的是,目前使用机器学习方法研究其潜在危害的研究方法受到可用数据的不足的阻碍。特别是,深度学习技术在只有少量或不平衡的数据集可用的领域面临挑战。克服这一挑战通常涉及对代表性不足的类别进行过度采样或增强现有数据以提高模型性能。本文提出了GANsemble:一个将数据增强与条件生成对抗网络(cGANs)相连接的两个模块框架,以生成类别条件的合成数据。首先,数据选择器模块通过搜索最佳数据增强策略来自动化增强策略的选择。接下来,cGAN模块使用此策略来训练cGAN以生成增强的合成数据。我们在一个小型且不平衡的微塑料数据集上实验了GANsemble框架。引入了Microplastic-cGAN(MPcGAN)算法,并建立了关于Frechet Inception Distance(FID)和Inception Scores(IS)的合成微塑料(SYMP)数据的基线。我们还提供了一个合成微塑料过滤器(SYMP-Filter)算法,以提高生成的SYMP的质量。此外,我们展示了在小型微塑料数据集中通过增强来修复类别不平衡的最佳过度采样量。据我们所知,这项研究是将生成人工智能首次应用于合成微塑料数据。
-
- 图表
- 解决问题如何解决小数据集和类别不平衡对于深度学习模型在微塑料领域中的应用所带来的挑战?
- 关键思路提出GANsemble框架,将数据增强和条件生成对抗网络(cGANs)相结合,生成类别相关的合成数据,解决小数据集和类别不平衡的问题。
- 其它亮点实验使用微塑料数据集进行验证,提出Microplastic-cGAN(MPcGAN)算法和SYMP-Filter算法,建立了SYMP数据的基准,并探讨了数据增强和过采样对于小数据集和类别不平衡的影响。此外,该研究是首次将生成式人工智能应用于微塑料数据的合成。
- 最近的相关研究包括:1)使用卷积神经网络(CNN)和图像分割技术进行微塑料图像分析;2)使用深度学习方法进行微塑料颗粒检测和分类。相关论文包括:1)“Convolutional Neural Networks for Automated Analysis of Microplastics in Environmental Samples”;2)“Deep Learning for Automated Classification and Measurement of Microplastics in Environmental Samples”。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流