【论文标题】Automating Outlier Detection via Meta-Learning
【作者团队】Yue Zhao, Ryan A. Rossi, Leman Akoglu
【发表时间】2020/9/22
【论文链接】https://arxiv.org/abs/2009.10606
【代码链接】https://github.com/yzhao062/metaod
【推荐理由】
本文来自卡内基梅隆大学和Adobe Research团队,该论文创新性的在异常值检测的模型选择问题和协同过滤中的冷启动问题之间建立了联系,首次提出一种基于元学习的自动进行离群点检测选择模型。
在新数据集上的进行无监督异常值检测(OD)任务时,如何才能自动地选择一种好的异常值检测方法及模型?到目前为止,OD的模型选择一直是一种“黑色艺术”。由于缺少有标签的已知数据及通用目标函数,因此任何模型评估都不可行。本文首次开发了基于元学习的数据驱动OD模型选择方法,称为METAOD。 该方法利用了大量检测模型在现有异常值检测基准数据集上的历史数据,并学习已有的经验,以自动在新数据集上选择有效的模型。为了捕获任务的相似性,本文引入了专门的元特征来量化数据集的离群特征。通过综合实验,本文证明了METAOD在选择一种检测模型方面的有效性,该模型明显优于最先进的异常检测器(例如LOF和iForest)以及各种最新的无监督元学习器,并且计算速度非常快。
图1:基于元学习的数据驱动异常值检测模型选择方法(METAOD)概述;从离线阶段转移到在线阶段(型号选择)的组件以蓝色显示
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢