- 简介随着云原生技术的发展,基于微服务的软件系统在故障发生时面临着准确定位根本原因的挑战。此外,云边协同环境引入了更多的困难,例如网络不稳定和跨网络段的高延迟。因此,在云边协同环境中准确识别微服务的根本原因已成为一项紧迫的问题。本文提出了MicroCERCL,一种新颖的方法,在云边协同环境中定位内核和应用程序级别的根本原因。我们的关键见解是,在不稳定和高延迟的云边协同环境中,故障通过直接调用和间接资源竞争依赖传播。在同时涉及多个微服务系统的混合部署中,这将变得更加复杂。利用这一见解,我们从内核级日志中提取有效内容,以优先定位内核级根本原因。此外,我们构建了一个异构动态拓扑堆栈,并训练了一个图神经网络模型,以在不依赖历史数据的情况下准确定位应用程序级别的根本原因。值得注意的是,我们发布了第一个基于云边协同环境的混合部署微服务系统基准测试(根据我们的了解是最大和最复杂的)。从基准测试收集的数据集上进行的实验表明,MicroCERCL可以准确地定位此类环境中微服务系统的根本原因,其在top-1准确度方面的表现明显优于现有方法,至少提高了24.1%。
-
- 图表
- 解决问题在云边协同环境中,微服务软件系统面临的根本原因本地化问题。
- 关键思路提出了一种新方法MicroCERCL,该方法通过提取内核级日志的有效内容来优先考虑定位内核级根本原因,并构建一个异构动态拓扑栈和训练图神经网络模型来准确定位应用级根本原因。
- 其它亮点论文发布了第一个基准混合部署微服务系统,展示了MicroCERCL在此类环境中准确定位微服务系统根本原因的能力,相比现有方法,其top-1准确率至少增加24.1%。
- 相关研究包括基于日志的故障定位,微服务根本原因定位,以及云边计算。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流