关于周刊

因果学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写了第12期《因果学习周刊》。

本期简介:本期周刊总结了NeurIPS 22中涉及到的一些因果推断的研究型文章,论文整体价值较高,对一些传统的基础的问题有了一些新的突破,例如从一组干预措施中在存在未观测混杂时的因果效应估计、用于治疗效果估计的异质特征空间上的迁移学习、估计现实世界的概念对NLP模型行为的因果效应等问题,这些文章也向前推进了一步,值得学习和借鉴!

周刊采用社区协作的模式产生,欢迎感兴趣的朋友们参与我们的工作,一起来推动因果学习社群的分享、学习和交流活动。可以扫描文末的二维码加入因果学习社区群。

本期贡献者:李昊轩 北京大学

 

关于周刊订阅

告诉大家一个好消息,《因果学习周刊》开启“订阅功能”,以后我们会向您自动推送最新版的《因果学习周刊》。订阅方法:

1,注册智源社区账号

2,点击周刊界面左上角的作者栏部分“因果学习周刊”(如下图),进入“因果学习周刊”主页。

 

3,点击“关注TA”(如下图)

4,您已经完成《因果学习周刊》订阅啦,以后智源社区自动向您推送最新版的《因果学习周刊》!

 

论文推荐

标题:NeurIPS 22 (Antwerp, Spotify)| Disentangling Causal Effects from Sets of Interventions in the Presence of Unobserved Confounders|从一组干预措施中在存在未观测混杂时分离出因果效应
简介:回答因果问题的能力在许多领域都是至关重要的,因为因果推理可以让人们了解干预措施的影响。在许多应用中,在一个给定的时间内只可能有一个单一的干预。然而,在某些重要领域,多种干预措施是同时应用的。将单一干预措施的效果与联合应用的干预措施区分开来是一项具有挑战性的任务--特别是由于同时应用的干预措施可以相互影响。未观察到的混杂因素对干预措施和结果都有影响,这使得这个问题变得更加困难。我们通过从观察数据和干预措施集中学习单一干预措施的效果来应对这一挑战。我们证明这在一般情况下是不可能的,但我们提供了识别证明,证明在某些类别的加性噪声模型中可以实现,甚至在存在未观察到的混杂因素的情况下。重要的是,我们展示了如何将观察到的协变量纳入其中,并学习以它们为条件的单一干预的异质性治疗效果。
 
标题:NeurIPS 22(Oxford,Cambridge)| Transfer Learning on Heterogeneous Feature Spaces for Treatment Effects Estimation|用于治疗效果估计的异质特征空间上的迁移学习
简介:本文考虑通过利用来自具有不同特征空间的源域的相关信息来改进对目标领域的条件平均治疗效果(CATE)的估计问题。这种用于CATE估计的异质迁移学习问题在医疗保健等领域无处不在,在这些领域中,我们可能希望对一个新的病人群体的治疗效果进行评估,而这些病人群体有不同的临床协变量和有限的数据。在本文中,我们通过引入几个构件来解决这个问题,这些构件使用表示学习来处理异质特征空间,并使用一个灵活的多任务架构,通过共享和私有层在不同领域的潜在结果函数之间迁移信息。然后,我们展示了这些构件如何被用来恢复标准CATE学习器的迁移学习等价物。在一个新的半合成数据模拟基准上,我们不仅展示了我们的异质迁移因果效应学习器在不同数据集上的性能改进,而且还从迁移的角度提供了对这些学习器之间差异的了解。
 
标题:NeurIPS 22(Adobe)| Sample Constrained Treatment Effect Estimation|样本约束下的治疗效果估计
简介:治疗效果估计是因果推断中的一个基本问题。我们的重点是设计有效的随机对照试验,以准确估计某种治疗对n个个体的影响。特别是,我们研究了样本约束的治疗效果估计,我们必须从人群中选择一个s远小于n个人的子集来进行实验。这个子集必须被进一步划分为治疗组和对照组。将整个人口划分为治疗组和控制组的算法,或选择一个具有代表性的子集的算法,已经得到了充分的研究。
在我们的环境中,关键的挑战是共同选择一个有代表性的子集和该子集的分区。我们重点关注线性效应模型下的个体和平均治疗效果估计。我们通过确定差异最小化和随机数值线性代数中使用的基于杠杆分数的抽样的联系,给出了可证明的有效实验设计和相应的估计。当s等于种群大小时,我们的理论结果获得了向已知的保证的平稳过渡。我们还从经验上证明了我们算法的性能。
 
标题:NeurIPS 22(MIT)|Falsification before Extrapolation in Causal Effect Estimation|在因果效应估计外推前先进行证伪
简介:在制定政策指南时,随机对照试验(RCTs)是一个黄金标准。然而,RCTs的范围往往很窄,而且缺乏更广泛的相关人群的数据。在这些人群中的因果效应通常是通过观察性数据集来估计的,而观察性数据集可能会受到未观察到的混杂因素和选择偏差的影响。鉴于一组观察性估计值(如来自多个研究),我们提出了一个元算法,试图拒绝有偏差的观察性估计。我们使用验证效应,即可以从RCT和观察数据中推断出的因果效应来做到这一点。在拒绝未通过该测试的估计值后,我们对RCT中未观察到的亚组的外推因果效应产生保守的置信区间。假设至少有一个观察估计值是渐进正态的,并且与验证效应和外推效应一致,我们为我们的算法所输出的区间的覆盖概率提供保证。为了便于在需要跨数据集进行因果效应迁移的情况下进行假设检验,我们给出了一些条件,在这些条件下,即使使用灵活的机器学习方法来估计讨厌参数,群体平均治疗效应的双重稳健估计也是渐近正态的。我们在半合成的和真实世界的数据集上说明了我们的方法的特性,并表明它与标准的元分析技术相比是有利的。
 
标题:NeurIPS 22(Toronto,Stanford)| Partial Identification of Treatment Effects with Implicit Generative Models|用隐式生成模型对治疗效果进行部分识别
简介:我们考虑部分识别的问题,即从观察数据中估计治疗效果的界限。虽然使用离散治疗变量或特定因果图(如工具变量)进行了研究,但最近使用深度生成模型的工具对部分识别进行了探索。我们提出了一种新的方法,使用由连续和离散随机变量组成的隐式生成模型对一般因果图中的平均治疗效果(ATE)进行部分识别。由于连续治疗的ATE通常是非规则的,我们利用响应函数的部分导数来定义ATE的规则近似值,我们称之为均匀平均治疗导数(UATD)。我们证明,在线性结构性因果模型(SCMs)中,我们的算法会收敛到ATE的紧约束。对于非线性SCMs,我们的经验表明,与直接优化ATE的方法相比,使用UATD会导致更严格和更稳定的界限。
 
标题:NeurIPS 22(Cornell)| Deep Multi-Modal Structural Equations For Causal Effect Estimation With Unstructured Proxies|用非结构化代理指标进行因果效应估计的深度多模态结构方程
简介:估算干预措施的效果,同时考虑混杂变量是因果推断中的一项关键任务。很多时候,混杂因素是无法观察到的,但我们可以获得大量的非结构化数据(图像、文本),这些数据含有关于缺失的混杂因素的宝贵代理信号。本文表明,利用现有算法经常忽略的非结构化数据,可以提高因果效应估计的准确性。具体来说,我们引入了深度多模态结构方程,这是一个生成模型,其中混杂物是潜在变量,非结构化数据是代理变量。这个模型支持多种多模态的代理变量(图像、文本)以及缺失数据。我们在基因组学和医疗卫生领域的任务中实证证明,我们的方法可以利用非结构化的输入修正混杂因素,有可能使以前没有用于因果推断的大量数据得到使用。
 
标题:NeurIPS 22(Technion,Stanford,Ghent)| CEBaB: Estimating the Causal Effects of Real-World Concepts on NLP Model Behavior|CEBaB:估计现实世界的概念对NLP模型行为的因果效应
简介:现代ML系统的规模和复杂性不断增加,提高了它们的预测能力,但使它们的行为更难解释。作为回应,许多模型解释技术已经被开发出来,但我们缺乏评估这些技术的明确标准。在本文中,我们将模型解释视为因果推理问题,即在实际输入数据的情况下,估计现实世界的概念对ML模型输出行为的因果影响。我们介绍了CEBaB,一个新的基准数据集,用于评估自然语言处理(NLP)中基于概念的解释方法。CEBaB由简短的餐厅评论和人类生成的反事实评论组成,其中就餐体验的某个方面(食物、噪音、氛围、服务)被修改。原始的和反事实的评论在方面和评论层面都有多重验证的情感评级的注释。CEBaB的丰富结构使我们能够超越输入特征,研究抽象的、真实世界的概念对模型行为的影响。我们使用CEBaB来比较一系列基于概念的解释方法的质量,这些方法涵盖了对问题的不同假设和概念,我们试图为这些方法的比较评估建立自然指标。
 

欢迎加入因果学习群

如果你正在从事或关注 因果学习研究、实现与应用,欢迎加入“智源社区-因果学习-交流群”。在这里,你可以:

  • 学习前沿知识、求解疑难困惑

  • 分享经验心得、展示风貌才华

  • 参与专属活动、结识研究伙伴

扫描下方二维码,加入因果学习兴趣群。备注:“姓名+单位+因果”才会验证进群哦。

内容中包含的图片若涉及版权问题,请及时与我们联系删除