简介:工具变量(Instrumental Variables, IV)是治疗随机化的来源,有条件地独立于结果,在未观察到的混杂因素的因果推理中具有重要作用。然而,现有的基于工具变量的反事实预测方法需要预先定义好的工具变量,而在许多现实场景中,找到有效的IV是一门艺术,而不是科学。此外,人为预先定义的IV可能会因为违反有效IV的条件从而引入错误。这些棘手的事实阻碍了基于IV的反事实预测方法的应用。在本文中,我们提出了一种新的自动工具变量分解(AutoIV)算法,从观测变量(IV候选变量)中自动生成IV的表示。具体来说,我们通过互信息最大化和最小化约束,让学到的IV表示分别满足与治疗和结果的相关性条件。我们也通过鼓励他们与治疗和结果相关来学习混杂表征。在对抗性博弈中,IV表征和混杂表征通过它们的约束条件争夺信息,这使得我们能够得到基于IV的反事实预测的有效的IV表征。大量的实验表明,我们的方法能够产生有效的IV表征来进行准确的基于IV的反事实预测。
链接:http://arxiv.org/abs/2107.05884
推荐理由:本文是况琨老师组的最新工作,提出了在表征学习中同时学习IV与混淆变量的框架,其问题建模十分新颖,有很大的参考价值。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢