LightGBM robust optimization algorithm based on topological data analysis

2024年06月19日
  • 简介
    为了增强轻量级梯度提升机(LightGBM)算法在图像分类中的鲁棒性,本文提出了一种基于拓扑数据分析(TDA)的鲁棒性优化算法,称为TDA-LightGBM,以解决噪声对图像分类的干扰。首先,该方法将特征工程过程分为两个流:像素特征流和拓扑特征流,分别进行特征提取。然后,这些像素和拓扑特征被合并为一个综合特征向量,作为LightGBM在图像分类任务中的输入。这种特征融合不仅包括传统的特征工程方法,而且利用拓扑结构信息更准确地包括图像的内在特征。其目标是克服传统图像处理中由数据噪声引起的特征提取不稳定和分类精度降低等挑战。实验结果表明,在有噪声的情况下,TDA-LightGBM在SOCOFing数据集的五个分类任务中比LightGBM提高了3%的准确率。在无噪声的情况下,TDA-LightGBM在两个分类任务上比LightGBM提高了0.5%的准确率,达到了惊人的99.8%的准确率。此外,该方法在存在噪声的情况下,将超声乳腺图像数据集和Masked CASIA WebFace数据集的分类准确率分别提高了6%和15%,超过了LightGBM。这些实证结果强调了TDA-LightGBM方法通过集成拓扑特征来增强LightGBM的鲁棒性,从而提高图像分类任务在数据扰动中的性能。
  • 图表
  • 解决问题
    提高LightGBM算法在图像分类中的鲁棒性,解决数据噪声对分类准确性的干扰问题。
  • 关键思路
    将特征工程分为像素特征流和拓扑特征流,将它们融合成综合特征向量,用于LightGBM进行图像分类。这种融合不仅包含传统的特征工程方法,还利用了拓扑结构信息来更准确地包括图像的内在特征。
  • 其它亮点
    实验证明,TDA-LightGBM在SOCOFing数据集上在噪声条件下比LightGBM提高了3%的准确率,在两个无噪声的分类任务上比LightGBM提高了0.5%的准确率。此外,该方法在乳腺癌数据集和Masked CASIA WebFace数据集上的分类准确率分别提高了6%和15%,在存在噪声的情况下超过了LightGBM。
  • 相关研究
    最近的相关研究包括“基于深度学习的图像分类方法”、“基于卷积神经网络的图像分类算法”等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论