LLM-Enhanced Causal Discovery in Temporal Domain from Interventional Data

2024年04月23日
  • 简介
    在信息技术运营的人工智能领域中,因果关系的发现对于图形构建的运维至关重要,有助于下游工业任务,如根本原因分析。作为一种新兴方法,时间因果关系发现旨在通过利用干预数据直接从观测数据中识别变量之间的时间因果关系。然而,现有的方法主要关注于合成数据集,过度依赖干预目标,忽略了隐藏在实际系统中的文本信息,无法对真实工业场景进行因果关系发现。为了解决这个问题,本文提出了在工业场景中研究时间因果关系发现的方法,面临两个关键挑战:1)如何在实践中发现因果关系,而不需要昂贵的干预目标;2)如何通过利用系统中复杂但丰富的文本信息来发现因果关系。为了解决这些挑战,我们提出了RealTCD框架,该框架能够利用领域知识发现时间因果关系而无需干预目标。具体而言,我们首先开发了一种基于得分的时间因果发现方法,能够通过策略性遮蔽和正则化发现根本原因分析的因果关系,而无需依赖干预目标。此外,通过使用大型语言模型(LLMs)来处理文本并整合领域知识,我们引入了LLM引导元初始化来提取隐藏在系统中的文本信息中的元知识,以提高发现的质量。我们对模拟和真实世界数据集进行了广泛的实验,以展示我们提出的RealTCD框架在发现时间因果结构方面优于现有基线的优越性。
  • 图表
  • 解决问题
    本论文旨在解决工业场景下的时间因果发现问题,包括如何在没有干预目标的情况下发现因果关系,以及如何利用系统中隐藏的文本信息进行因果关系的发现。
  • 关键思路
    论文提出了RealTCD框架,通过引入领域知识,使用基于分数的时间因果发现方法和基于大型语言模型的元初始化方法,实现了在没有干预目标的情况下发现因果关系,同时提高了因果结构的发现质量。
  • 其它亮点
    论文在模拟和真实数据集上进行了广泛的实验,证明了RealTCD框架在发现时间因果结构方面的优越性。此外,论文还使用了大型语言模型和领域知识,为时间因果发现的研究提供了新的思路和方法。
  • 相关研究
    在相关研究方面,最近的一些论文包括“Temporal causal discovery with latent confounders”和“Discovering causal signals in images”等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论