南京大学Kai Ming Ting团队 | 综述：基于孤立机制的异常检测研究

异常检测是一个长期活跃的研究领域，在金融、安全和制造等诸多领域有着广泛的应用。然而，在大数据时代，大规模、高维度和异构数据普遍存在，这对异常检测算法的效率和性能提出了挑战。基于孤立机制的无监督异常检测(Isolation-based unsupervised anomaly detection)是一种新颖且有效的数据异常识别方法。其核心思想是异常点数量少且与正常实例不同，因此可以通过随机划分被轻易地"孤立"出来。与现有方法相比，基于孤立机制的方法具有若干优势，例如计算复杂度低、内存占用少、可扩展性高、对噪声和不相关特征鲁棒，并且无需先验知识或繁重的参数调优。来自大湾区大学、清华大学、澳大利亚迪肯大学、南京信息工程大学及南京大学的研究者们综述回顾了最先进的基于孤立机制的异常检测方法，包括其数据划分策略、异常评分函数和算法细节。文章还讨论了基于孤立机制的方法在不同场景下的扩展与应用，例如在流数据、时间序列、轨迹和图像数据集中检测异常。最后，本文指出了基于孤立机制的异常检测研究面临的一些开放性挑战和未来方向。文章已发表于《机器智能研究（英文）》2025年第5期，全文开放获取。

图片来自Springer

全文下载：

Anomaly Detection Based on Isolation Mechanisms: A Survey

Yang Cao, Haolong Xiang, Hang Zhang, Ye Zhu & Kai Ming Ting

https://link.springer.com/article/10.1007/s11633-025-1554-4

https://www.mi-research.net/article/doi/10.1007/s11633-025-1554-4

全文导读

异常检测是指识别数据集中与正常模式显著不同的数据点。对数据中异常的研究可追溯至19世纪的统计学。近年来，异常检测已成为医疗保健、金融、安全、能源和制造等众多科研与工业领域中的一项关键任务，有助于监控、控制和保障各种流程与系统。

根据是否使用神经网络进行特征学习，异常检测方法可大致分为两类，即浅层方法和深度方法。此外，根据建模方法，这些方法还可进一步分为单分类、基于概率、基于距离和基于重构等类别。每种方法都有其独特的优势和局限性，需要根据具体的应用场景和需求进行谨慎选择。

近年来，基于深度神经网络的自监督学习方法受到了广泛关注，并在异常检测中展现出强大的性能。尽管这些方法不需要标注数据，但它们通常依赖于复杂的数据增强策略和伪标签生成，需要大量的计算资源和大规模训练。

本文重点关注基于孤立机制的异常检测方法，这些方法属于浅层、基于距离的类别。与深度学习方法相比，基于孤立机制的方法提供了一种轻量级且计算高效的替代方案，特别适用于需要高时效性、强可解释性以及适用于边缘部署或工业应用的实际场景。基于孤立机制的方法完全在无监督学习设置下运行，不需要标注数据或关于异常的先验知识。通过利用数据的统计或结构特性，基于孤立机制的方法可以直接从数据内在特征的偏差中检测出异常，这使其非常适用于制造、安全和金融等通常无法获取或不切实际收集标注数据集的领域。

不同异常检测类型展示

基于孤立机制方法的核心思想是采用一种隔离机制，在输入数据空间中构建划分，使得异常更有可能与大多数数据分离开来。该系列中首个且最具代表性的方法是孤立森林(iForest)。在其成功之后，为了应对特定挑战和提升性能，研究者提出了各种扩展和改进方法，包括使用最近邻集成机制的孤立异常检测、扩展孤立森林、OptiForest以及孤立分布核。值得注意的是，这些方法均被设计为无需任何学习即可检测异常。

本文是首篇关于基于孤立机制的无监督异常检测的全面综述。它回顾了基于孤立机制的异常检测方法，涵盖了它们的数据划分、异常评分和算法方面。本文还探讨了基于孤立机制的方法在各种场景下的扩展与应用，例如流数据、时间序列、轨迹和图像数据集。最后，本文着重指出了一些开放性挑战和未来研究方向。

全文下载：

Anomaly Detection Based on Isolation Mechanisms: A Survey

Yang Cao, Haolong Xiang, Hang Zhang, Ye Zhu & Kai Ming Ting

https://link.springer.com/article/10.1007/s11633-025-1554-4

https://www.mi-research.net/article/doi/10.1007/s11633-025-1554-4

BibTex:

@Article {MIR-2024-05-174,

author={ Yang Cao, Haolong Xiang, Hang Zhang, Ye Zhu, Kai Ming Ting },

journal={Machine Intelligence Research},

title={Anomaly Detection Based on Isolation Mechanisms: A Survey},

year={2025},

volume={22},

issue={5},

pages={849-865},

doi={10.1007/s11633-025-1554-4} }

特别感谢本文第一作者曹阳博士对以上内容的审阅和修改！

∨

关于Machine Intelligence Research

Machine Intelligence Research（简称MIR，原刊名International Journal of Automation and Computing）由中国科学院自动化研究所主办，于2022年正式出版。MIR立足国内、面向全球，着眼于服务国家战略需求，刊发机器智能领域最新原创研究性论文、综述、评论等，全面报道国际机器智能领域的基础理论和前沿创新研究成果，促进国际学术交流与学科发展，服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划"，已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录，入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区，最佳排名挺进Top 4%，2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4，位列人工智能及自动化&控制系统两个领域JCR Q1区；2025年发布的最新影响因子达8.7，继续跻身JCR Q1区，最佳排名进入全球第6名；2025年一举进入中科院期刊分区表计算机科学二区。

▼

往期目录

▼

2025年第5期 | 生成式模型、疾病诊断、步态识别、行人再识别......

2025年第4期 | 特约专题: 具身智能

2025年第3期 | 大语言模型、医学图像分割、图像阴影去除、写作风格变化检测......

2025年第2期 | 常识知识获取、图因子分解机、横向联邦学习、分层强化学习...

2025年第1期 | 机器视觉、机器人、神经网络、反事实学习、小样本信息网络...

2024年第6期 | 图神经网络，卷积神经网络，生物识别技术...

2024年第5期 | 大语言模型，无人系统，统一分类与拒识...

2024年第4期 | 特约专题: 多模态表征学习

2024年第3期 | 分布式深度强化学习，知识图谱，推荐系统，3D视觉，联邦学习...