Online Drift Detection with Maximum Concept Discrepancy

2024年07月07日
  • 简介
    在互联网时代,从海量数据流中进行持续学习变得尤为关键。然而,数据流通常不会在时间上遵循相同的分布,导致了所谓的概念漂移现象。由于固定的静态模型不可靠,无法推断出概念漂移的数据流,因此建立一种适应性机制来检测概念漂移至关重要。目前的概念漂移检测方法主要假定下游模型的标签或错误率已知和/或数据流中存在基本的统计特性。然而,这些方法难以处理高维度的、具有复杂不规则分布变化的数据流,这在实际应用中更为普遍。在本文中,我们提出了一种新颖的概念漂移检测方法MCD-DD,它基于最大概念差异,灵感来自于最大均值差异。我们的方法可以通过对概念嵌入的对比学习来自适应地识别不同形式的概念漂移,而无需依赖标签或统计特性。通过在合成和实际场景下进行彻底的实验,我们证明了所提出的方法在识别概念漂移方面优于现有基线,并具有高可解释性的定性分析能力。
  • 图表
  • 解决问题
    本论文旨在解决数据流中的概念漂移检测问题,提出了一种新的基于最大概念差异的检测方法。
  • 关键思路
    本文提出的MCD-DD方法通过对概念嵌入进行对比学习,能够自适应地识别不同形式的概念漂移,而不依赖于标签或统计属性。
  • 其它亮点
    论文通过实验验证了MCD-DD方法的有效性,相比现有的基于标签或统计属性的方法,在识别概念漂移方面表现更好。此外,该方法具有高可解释性。
  • 相关研究
    近期的相关研究包括基于标签和统计属性的概念漂移检测方法,如DDM、EDDM和ADWIN等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论