Active and Passive Causal Inference Learning

Daniel Jiwoong Im, Kyunghyun Cho
[New York University]

主动和被动因果推断学习

  • 将因果推断(CI)方法分为主动学习和被动学习,主动学习通过干预,被动学习从观测数据中学习。
  • 主动学习包括随机对照试验(RCT),随机分配treatment,允许无偏估计治疗效果,但可能效率低下。
  • 上下文多臂bandit根据上下文选择动作,在探索和利用之间取得平衡,可用于为CI收集干预数据,或直接学习因果图。可以处理如未观察到的混杂变量等复杂情况。
  • 被动学习包括匹配、逆概率权重(IPW)和双鲁棒方法,以从观察数据中消除混杂偏差。
  • 表示学习方法在高维数据上使用深度学习,正则化防止学习虚假相关,反事实平滑使治疗组/对照组表示相似。
  • 潜变量模型推断未观察到的混杂变量,但需要额外假设,统一treatment VAE 处理训练和推理之间的协变量位移。
  • 主动和被动方法可以组合使用,Bandit 收集数据,被动方法估计treatment效果。
  • 各种 CI 方法具有不同的权衡。主动学习直接干预,但可能效率低下。从观察数据进行被动学习需要小心避免偏差。
  • 使用 bandit 进行因果发现,使用潜在变量来推断隐藏的混杂变量,以及表示学习中的正则化防止虚假相关。

动机:为了帮助对因果推断感兴趣但还不熟悉的机器学习研究人员、工程师和学生,提供一个起点和学习资料的集合。
方法:论文通过分类为主动和被动两种方法,介绍和讨论了随机对照试验、强化学习和深度学习等因果推断技术。
优势:提供了一个丰富的起点,涵盖了不同的因果推断方法和技术,对于进一步研究和学习因果推断非常有帮助。

一句话总结: 提供了一个起点,介绍了因果推断的基本概念和方法,以及主动和被动两种方法的应用和优化。

https://arxiv.org/abs/2308.09248 


图片
图片