LEMMA-RCA: A Large Multi-modal Multi-domain Dataset for Root Cause Analysis

2024年06月08日
  • 简介
    根本原因分析(RCA)对于提高复杂系统的可靠性和性能至关重要。然而,该领域的进展受到缺乏专门用于RCA的大规模开源数据集的阻碍。为了弥补这一差距,我们介绍了LEMA-RCA,这是一个大型数据集,旨在为多个领域和模态下的各种RCA任务提供支持。LEMA-RCA包括来自IT和OT操作系统的各种真实故障场景,包括微服务、水分配和水处理系统,涉及数百个系统实体。我们通过在各种设置下测试八种基线方法在此数据集上的性能,包括离线和在线模式以及单个和多个模态,来评估LEMA-RCA的质量。我们的实验结果证明了LEMA-RCA的高质量。该数据集可在https://lemma-rca.github.io/公开获取。
  • 图表
  • 解决问题
    LEMMA-RCA论文旨在解决根本原因分析(RCA)领域缺乏大规模、开源数据集的问题。
  • 关键思路
    LEMMA-RCA是一个大型数据集,旨在为多个领域和模态下的根本原因分析任务提供数据。
  • 其它亮点
    LEMMA-RCA包含来自IT和OT运营系统的各种真实故障场景,涵盖微服务、水分配和水处理系统,涉及数百个系统实体。作者评估了八种基线方法在LEMMA-RCA上的性能,证明了数据集的高质量。数据集可以在https://lemma-rca.github.io/上公开获取。
  • 相关研究
    最近在这个领域中,还有一些相关的研究。例如,"A Survey of Root Cause Analysis Techniques for Cloud Computing Systems"和"Deep Learning Based Root Cause Analysis for Cloud Systems"。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论