因果推断面临的核心问题是反事实样本缺失。一般情况下同一个个体只接收到一种干预,没有其他干预下的转化数据,即我们获得的数据为一种干预下的观察数据,目标是学习每个个体上的处理效应(不同干预变量下的效果)。近些年,基于解耦表征的方法是因果效应估计的主流研究方向,即把输入的协变量分解成三个潜在因子包括工具因子(Instrumental Factor,只影响干预变量的因子)、混淆因子(Confounding Factor,同时影响干预变量和干预结果的因子)和调整因子(Adjustment Factor,只影响干预结果的因子)。然而如何高效、准确学习解耦因子仍然是一个开放性的问题,这也是能够正确识别个体处理效应的必要条件。目前的研究方法未能获取独立的解耦因子,在本文中,我们提出了通过互信息最小化来帮助学习反事实推断中的解耦表征,并在学习潜在因子时利用多任务框架来共享信息,在公开数据集和用户增长方面的工业数据集的实验证明了该方法效果超过目前SOTA的方法。
该项工作是阿里妈妈客户增长算法团队在客户增长问题上的实践总结,基于该项工作整理的论文已发表在SIGIR 2022。
论文标题:
Learning Disentangled Representations for Counterfactual Regression via Mutual Information Minimization
论文链接:https://doi.org/10.1145/3477495.3532011
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢