简介:因果推断在电子商务和精准医疗等多个领域有着广泛的应用,其性能在很大程度上依赖于对个体治疗效果(ITE)的准确估计。传统上,ITE的预测是通过在各自的样本空间中分别模拟治疗和控制的反应函数来实现的。然而,这种方法在实践中通常会遇到两个问题,即由于治疗偏差造成的治疗组和控制组之间的分布分歧,以及其人口规模的显著样本不平衡。本文提出了深度全空间交叉网络(DESCN),从端到端的角度对治疗效果进行建模。DESCN通过交叉网络以多任务学习的方式捕捉治疗倾向、反应和隐性治疗效果的综合信息。我们的方法在整个样本空间中联合学习治疗和反应函数以避免治疗偏差,并采用中间的伪治疗效果预测网络来缓解样本不平衡。我们在合成数据集和电子商务券分销业务的大规模生产数据集上进行了广泛的实验。结果表明,DESCN可以成功地提高ITE估计的准确性,并改善uplift排名的性能。我们发布了生产数据集的样本和源代码,以促进社区的未来研究,据我们所知,这是第一个用于因果推断的大规模公开偏向处理数据集。

论文地址:https://arxiv.org/pdf/2207.09920.pdf

代码:https://github.com/kailiang-zhong/DESCN

内容中包含的图片若涉及版权问题,请及时与我们联系删除