关于周刊

因果学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。为帮助研究与工程人员了解该领域的相关进展和资讯,智源社区结合领域内容,撰写了第11期《因果学习周刊》。

本期简介:本期周刊总结了KDD 22中涉及到的一些因果推断及其在工业界的应用文章,论文整体价值较高,对一些传统的基础的问题有了一些新的突破,例如在超图上学习因果效应、通用双稳健去偏框架、解决推荐领域的未观测混杂、端到端的X-Learner用于Uplift建模等问题,这些文章也向前推进了一步,值得学习和借鉴!

周刊采用社区协作的模式产生,欢迎感兴趣的朋友们参与我们的工作,一起来推动因果学习社群的分享、学习和交流活动。可以扫描文末的二维码加入因果学习社区群。

本期贡献者:李昊轩 北京大学

 

关于周刊订阅

告诉大家一个好消息,《因果学习周刊》开启“订阅功能”,以后我们会向您自动推送最新版的《因果学习周刊》。订阅方法:

1,注册智源社区账号

2,点击周刊界面左上角的作者栏部分“因果学习周刊”(如下图),进入“因果学习周刊”主页。

 

3,点击“关注TA”(如下图)

4,您已经完成《因果学习周刊》订阅啦,以后智源社区自动向您推送最新版的《因果学习周刊》!

 

论文推荐

标题:KDD 22 Best Paper(弗吉尼亚大学,微软)| 在超图上学习因果效应

简介:超图为建模节点之间的多路组互动提供了一个有效的抽象,其中每个超图可以连接任意数量的节点。与大多数现有研究不同的是,我们从因果关系的角度来研究超图。具体来说,在本文中,我们关注超图上的个体治疗效果(ITE)估计问题,旨在估计一项干预措施(如戴面罩)对每个个体节点的结果(如COVID-19感染)会产生多大的因果关系。现有的ITE估计工作要么假设一个人的结果不应该受到其他个体的治疗分配的影响(即没有干扰),要么假设干扰只存在于普通图中的一对连接个体之间。我们认为,这些假设在现实世界的超图上是不现实的,由于群体互动的存在,高阶干扰会影响最终的ITE估计。在这项工作中,我们研究了高阶干扰建模,并提出了一个由超图神经网络驱动的新因果关系学习框架。在真实世界的超图上进行的大量实验验证了我们的框架比现有基线的优越性。

阅读详情

 

标题:KDD 22(华为诺亚,北大)| 一个通用的用于点击后转化率预测的双稳健学习框架

简介:点击后转化率(CVR)的预测是在一系列工业应用中发现用户兴趣和增加平台收入的一项重要任务。这项任务中最具挑战性的问题之一是存在严重的选择偏差,这是由用户固有的自我选择行为和系统的项目选择过程造成的。目前,双重稳健(DR)学习方法在去偏移CVR预测方面取得了最先进的性能。然而,在本文中,通过对DR方法的偏差、方差和泛化界进行理论分析,我们发现现有的DR方法可能由于对倾向得分的不准确估计和归因错误而导致泛化效果不佳,这在实践中经常发生。在这种分析的激励下,我们提出了一个广义的学习框架,它不仅统一了现有的DR方法,而且还提供了一个宝贵的机会来开发一系列新的去偏移技术,以适应不同的应用场景。基于该框架,我们提出了两种新的DR方法,即DR-BIAS和DR-MSE。DR-BIAS直接控制了DR损失的偏差,而DR-MSE则灵活地平衡了偏差和变异,实现了更好的泛化性能。此外,我们还为CVR预测中的DR-MSE提出了一种新的三层联合学习优化方法,以及相应的高效训练算法。我们在真实世界和半合成数据集上进行了广泛的实验,验证了我们提出的方法的有效性。

阅读详情

 

标题:KDD 22(中科大,北大)| 基于敏感性分析的推荐系统中的未观测混杂去偏

简介:推荐系统应该回答 "如果向用户推荐一个项目,反馈会是什么"这一干预性问题,要求估计推荐对用户反馈的因果效应。一般来说,这需要阻断同时影响推荐和反馈的混杂因素的影响。为了处理混杂偏差,一种策略是将倾向性评分纳入模型学习。然而,基于倾向性评分的方法假设所有的混杂因素都观测到了,即不存在未测量的混杂因素(例如,用户的财务状况),这可能导致有偏的倾向性并损害推荐性能。为此,我们提出了Robust Deconfounder(RD),它考虑到了未测量的混杂因素对倾向性的影响,在较弱的假设下,这种影响是有界限的。它通过敏感性分析来估计边界,通过对抗性学习在边界内学习一个对未测量的混杂因素具有鲁棒性的推荐模型。然而,在一定范围内追求稳健性可能会限制模型的准确性。为了避免鲁棒性和准确性之间的权衡,我们进一步提出了基准RD(BRD),将预先训练好的模型纳入到学习中作为基准。理论分析证明,与现有的基于倾向性的去偏方法相比,我们的方法具有更强的鲁棒性,同时也证明了BRD的无害特性。我们的方法适用于任何基于倾向性的估计器,在三个真实世界的数据集上进行了实验,以证明我们的方法的有效性,包括IPS、Doubly Robust和AutoDebias。

阅读详情

 

标题:KDD 22(阿里)| DESCN:用于个体治疗效果估计的深度全空间交叉网络

简介:因果推断在电子商务和精准医疗等多个领域有着广泛的应用,其性能在很大程度上依赖于对个体治疗效果(ITE)的准确估计。传统上,ITE的预测是通过在各自的样本空间中分别模拟治疗和控制的反应函数来实现的。然而,这种方法在实践中通常会遇到两个问题,即由于治疗偏差造成的治疗组和控制组之间的分布分歧,以及其人口规模的显著样本不平衡。本文提出了深度全空间交叉网络(DESCN),从端到端的角度对治疗效果进行建模。DESCN通过交叉网络以多任务学习的方式捕捉治疗倾向、反应和隐性治疗效果的综合信息。我们的方法在整个样本空间中联合学习治疗和反应函数以避免治疗偏差,并采用中间的伪治疗效果预测网络来缓解样本不平衡。我们在合成数据集和电子商务券分销业务的大规模生产数据集上进行了广泛的实验。结果表明,DESCN可以成功地提高ITE估计的准确性,并改善uplift排名的性能。我们发布了生产数据集的样本和源代码,以促进社区的未来研究,据我们所知,这是第一个用于因果推断的大规模公开偏向处理数据集。

阅读详情

 

标题:KDD 22(中科院,阿里)| CausalMTA:消除因果多触点归因的用户混杂偏差

简介:多触点归因(MTA: Multi Touch Attribution) 是一种基于数据驱动(Data-driven)的归因技术,着重还原用户触点轨迹并公平分配贡献,帮助商家优化广告资源投放,从而优化提升整体营销收益。多触点归因是预算分配与智能广告投放的基础,现有方法多采用历史数据训练一个模型以预测广告触点路径的转化概率,然后根据合作博弈理论Shapley Value基于反事实预测结果公正分配每个触点的贡献。这类方法的一大假设是转化预测模型需是无偏的,假定在计算Shapley Value枚举的浏览路径上做到精准预测,这些浏览路径包含真实存在与非真实存在两种情况。然而广告系统的投放与用户的转化行为都受到用户偏好的影响,不同广告触点背后的人群画像存在明显的差异,导致上述假设并不成立,即混淆偏差问题与反事实预测中的OOD(out of distribution)问题。本文提出了基于因果推断技术的无偏广告多渠道归因模型 MTA,消除了用户静态与动态混淆偏差的影响,从而训练无偏的转化预测模型,通过理论分析论证了CausalMTA在给定充足广告路径下的有效性。在仿真数据集、Criteo公开数据集以及阿里妈妈真实数据集的大量实验结果表明,CausalMTA不仅在预测转化率上超过其他SOTA方法,同时还能为不同广告渠道产生有意义的归因值。

阅读详情

 

标题:KDD 22(清华)| 推荐中的不变偏好学习用于去偏

简介:目前的推荐系统在在线服务中取得了巨大的成功,例如电子商务和社交媒体。然而,它们在实际场景中仍然受到性能下降的影响,因为在用户行为的生成过程中总会出现各种偏差。尽管最近在解决一些特定类型的偏差方面取得了进展,但各种数据偏差,其中一些甚至是未知的,往往在实际应用中混杂在一起。尽管随机的(或无偏见的)数据可能有助于实现一般去偏的目的,但这样的数据要么很难获得,要么会产生高的实验成本。在本文中,我们考虑了一个更实际的环境,即我们的目标是仅用有偏的观察数据来进行一般去偏。我们假设观察到的用户行为是由不变的偏好(即用户的真实偏好)和变异的偏好(受一些未观察到的干扰因素影响)决定的。我们提出了一个新的推荐框架,称为InvPref,它通过估计不同类型的潜在偏见所对应的异质环境,从有偏见的观察用户行为中迭代分解出不变的偏好和变异的偏好。广泛的实验,包括一般去偏和特殊去偏的设置,验证了我们方法的优势。

阅读详情

 

标题:KDD 22(快手)| 去除视频推荐的观看时间预测中的时间偏差

简介:观看时间的预测仍然是通过视频推荐加强用户参与的一个关键因素。然而,观看时间的预测不仅取决于用户和视频之间的匹配,而且经常被视频本身的持续时间所误导。为了提高观看时间,推荐总是偏向于长时长的视频。在这种不平衡的数据上训练出来的模型面临着偏差放大的风险,它误导平台过度推荐长时长的视频,却忽略了用户的潜在兴趣。我们采用了一个因果图,说明持续时间是一个混杂因素,它同时影响着视频曝光和观看时间预测-对视频的第一个影响导致了偏见问题,应该被消除,而对观看时间的第二个影响则源于视频的内在特性,应该被保留。为了消除不希望出现的偏差,同时利用自然效应,我们提出了一个基于Duration-Deconfounded Quantile(D2Q)的观看时间预测框架,该框架允许在工业生产系统中进行扩展。通过广泛的离线评估和现场实验,我们展示了这一duration-deconfounding框架的有效性,其表现明显优于最先进的基线。我们已经在快手App上全面启动了我们的方法,由于更准确的观看时间预测,实时视频消费得到了大幅改善。

阅读详情

 

欢迎加入因果学习群

如果你正在从事或关注 因果学习研究、实现与应用,欢迎加入“智源社区-因果学习-交流群”。在这里,你可以:

  • 学习前沿知识、求解疑难困惑

  • 分享经验心得、展示风貌才华

  • 参与专属活动、结识研究伙伴

扫描下方二维码,加入因果学习兴趣群。备注:“姓名+单位+因果”才会验证进群哦。

内容中包含的图片若涉及版权问题,请及时与我们联系删除