

关键词:因果发现 代理变量 不可观测的混淆因子

导 读
本文是对发表于机器学习领域顶级会议 ICML 2024 的论文 Causal Discovery via Conditional Independence Testing with Proxy Variables 的解读。该论文由北京大学王亦洲课题组和复旦大学孙鑫伟助理教授合作完成,第一作者为北京大学博士生刘鸣洲。
本文提出了一种基于代理变量(Proxy Variable)的条件独立性检验方法,为从含有隐变量的环境中识别因果关系提供了理论保证。本文所述的方法在仿真数据集和败血症用药有效性分析中得到了验证。
论文链接:
https://arxiv.org/abs/2305.05281
开源代码:
https://github.com/lmz123321/proxy_causal_discovery
现场交流:
Poster Session 5 Hall C 4-9 #1707
Thu 25 Jul 17:30 p.m. - 7 p.m.
01
方法概览
区分因果关系与相关关系是许多科学研究中的根本问题,例如经济学、医学和通用人工智能。因果关系消除了混淆因子、中介因子等引入的伪相关,因而能帮助我们做出更可靠的决策。
在因果充分性假设(即环境中不含未观测的隐变量)下,因果发现可以通过检验条件独立性的方法来判断因果关系是否存在。然而,当环境中存在隐变量时,这一方法不再准确。这是由于我们无法收集隐变量的数据、也无法对其进行干预。因此,我们无法消除隐变量中的混淆因子、中介因子等引入的伪相关性。
为了解决这一问题,Pearl 等人[1]引入了代理变量(图1)的概念。通常,代理变量可以是对隐变量的一种含噪声观测、或是隐变量的可观测后代。通过代理变量,我们可以调整隐变量引入的伪相关性,从而实现可识别性。然而,Pearl 等人[1] 和 Miao 等人[2,3]提出的代理变量调整方法局限于离散变量、或依赖于很强的参数化假设,限制了代理变量的应用。

图1:基于代理变量的因果发现。目标为判断
本文提出了一中基于代理变量的假设检验,可以在不依赖参数化假设的情况下,识别连续变量之间的因果关系。具体来说,本文的策略是寻找一种恰当的离散化方法,使得被离散变量之间的概率矩阵在零假设下满足一个线性方程组。该方程组的系数向量(Coefficient Vector)是可识别的,因而,我们可以通过线性回归的残差的大小来判断零假设是否成立。为了实现这一目标,我们首先引入了一个离散化过程,该过程能确保离散后变量之间的概率矩阵满足满秩约束,进而保证线性方程系数向量的可识别性。其次,我们分析了离散化过程引入的误差。在平滑性条件下,我们说明这一误差可以被控制到任意小。最后,基于上述分析,我们提出了一个基于线性回归残差的假设检验统计量,并分析了渐进意义下假设检验的显著性水平和检定力。
最后,本文指出了所述方法在时间序列因果发现中的一种应用,即可以利用未观测时间变量的可观测后代作为其代理变量,实现对时间序列因果图的识别。该结论是项目组 NeurIPS 2023 论文Causal Discovery from Subsampled Time Series with Proxy Variables 的一部分。
02
背景介绍
问题设定。我们考虑判断两个变量
在 Markovian 和 Faithfulness 条件下,识别
值得注意的是,我们的方法能够判断
Miao 等人[2]所述的方法。对于离散变量,Miao 等人提出了一种基于代理变量
这种联系是由于
尽管上述方法已被证明对离散变量是有效的,如何将其推广到连续变量是一个困难的问题。这是由于公式 (2) 依赖的条件独立性在离散化后可能不再成立。此外,为了保证系数向量的可识别性,我们应该设计一个恰当的离散化过程使得
03
方 法
* 本章中的假设、示例、命题等编号均对应原文。
在本章中,我们介绍一种基于离散化的假设检验流程。这一流程的核心是寻找一种离散化方法来建立公式 (1) 的可识别性。
为了实现这一目标,我们首先引入一种离散化方法,该方法在完备性条件(Completeness)下可以保证离散化后变量
基于完备性的离散化
我们首先介绍一种离散化方法来建立公式 (1) 所需的可识别性。该方法依赖于以下的完备性假设:
假设 4.1(完备性)。假设条件分布
值得注意的是,假设 4.1 所描述的完备性被很多工作类似的采用[2,3],它的成立基本上只要求结构方程中的外源变量有非零的描述函数。
示例 4.2(满足完备性的加性噪声模型)。假设
在假设 4.1 下,我们证明可以找到一个离散化过程使得
命题 4.4。假设 4.1 成立。则对于任何
受命题 4.4 的启发,我们提出算法 1 来具体的搜索满足矩阵秩约束的离散化,这一算法的设计原理请参见原文的介绍。

离散化误差分析
我们讨论离散化误差的控制问题。具体来说,我们说明在如下的平滑性假设下,可以通过细致的离散化将误差控制到任意小。
假设 4.7(TV 平滑性)。假设映射
为了理解假设 4.7 对于控制误差
值得注意的是,假设 4.7 在具有连续可导的结构方程的结构因果模型中均可成立,是一种比较弱的假设,具体的说明请参见原文的示例 4.8。
命题 4.9。假设
命题 4.9 说明在平滑性条件下,只要离散化格选取的足够小,就能将误差控制到任意小。此外,为了解决
假设检验
令
定理 4.15。假设 4.1,4.7 成立,则在零假设下,
定理 4.18。假设 4.1,4.7,4.16 成立,则对于任意
04
实 验
本文在图1所述的两种因果图上进行了仿真实验,结果说明本文的方法能实现一致的显著性水平和检定力。

图2. 不同样本量下假设检验的第一类和第二类错误率。对于一个正确的检验过程,第一类错误率应该接近显著性水平

图3. 不同离散化粒度下假设检验的第一类和第二类错误率。
此外,本文还在败血症用药有效性问题上进行了实验,结果表明本文提出的方法能有效区分因果关系和隐变量带来的伪相关关系。

图4. 描述败血症的因果图以及各种方法的结果比较。
05
应用于时间序列因果发现
本文所述的基于代理变量的假设检验方法可以应用于时间序列因果图学习的问题中。具体来说,在时间序列中,每个未观测变量都存在一个可观测的后代(即该变量在未来某个可观测时刻的测量)。因此,我们可以利用这一可观测后代作为未观测变量的代理变量,对未观测变量引入的偏移进行调整。

图5. 利用代理变量区分直接因果效应(
参考文献
[1] Kuroki, M. and Pearl, J. Measurement bias and effect restoration in causal inference. Biometrika, 101(2):423–437, 2014.
[2] Miao, W., Geng, Z., and Tchetgen Tchetgen, E. J. Identifying causal effects with proxy variables of an unmeasured confounder. Biometrika, 105(4):987–993, 2018.
[3] Miao, W., Hu, W., Ogburn, E. L., and Zhou, X.-H. Identifying effects of multiple treatments in the presence of unmeasured confounding. Journal of the American Statistical Association, pp. 1–15, 2022.

图文 | 刘鸣洲
Computer Vision and Digital Art (CVDA)
About CVDA
The Computer Vision and Digital Art (CVDA) research group was founded in 2007 within the National Engineering Laboratory for Video Technology at Peking University led be Prof. Yizhou Wang. The group focuses on developing computational theories and models to solve challenging computer vision problems in light of biologically plausible evidences of visual perception and cognition. The primary goal of CVDA is to establish a mathematical foundation of understanding the computational aspect of the robust and efficient mechanisms of human visual perception, cognition, learning and even more. We also believe that the marriage of science and art will stimulate exciting inspirations on producing creative expressions of visual patterns.
CVDA近期科研动态


— 版权声明 —
本微信公众号所有内容,由北京大学前沿计算研究中心微信自身创作、收集的文字、图片和音视频资料,版权属北京大学前沿计算研究中心微信所有;从公开渠道收集、整理及授权转载的文字、图片和音视频资料,版权属原作者。本公众号内容原作者如不愿意在本号刊登内容,请及时通知本号,予以删除。

点击“阅读原文”转论文地址
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢