- 简介因果效应通常用总体摘要来描述,但当不同子组存在异质性治疗效应时,这可能会提供不完整的图片。由于子组结构通常是未知的,因此识别和评估子组效应比总体效应更具挑战性。我们提出了一个新的解决方案:因果k均值聚类,它利用广泛使用的k均值聚类算法来发现未知的子组结构。我们的问题与传统的聚类设置有很大的不同,因为要聚类的变量是未知的反事实函数。我们提出了一个插件估计器,它简单易用,可以使用现成的算法进行实现,并研究了它的收敛速度。我们还基于非参数效率理论和双机器学习开发了一种新的偏差校正估计器,并表明这个估计器在大型非参数模型中实现了快速的根n速率和渐近正态性。我们提出的方法特别适用于具有多个治疗水平的现代结果研究。此外,我们的框架可扩展到使用通用伪结果进行聚类,例如部分观察到的结果或其他未知函数。最后,我们通过模拟探索有限样本性质,并在青少年物质滥用治疗计划的研究中说明了所提出的方法。
- 图表
- 解决问题论文旨在解决在亚组效应存在的情况下,如何识别和评估亚组效应的问题。提出了一种新的解决方案:因果k均值聚类。
- 关键思路使用k均值聚类算法来发现未知的亚组结构,并提出了一个简单的插值估计器和一个基于非参数效率理论和双机器学习的新的偏差校正估计器。
- 其它亮点该方法特别适用于具有多个治疗水平的现代结果广泛的研究。通过模拟研究探索了有限样本性质,并在青少年药物滥用治疗项目的研究中展示了该方法。
- 与最近的研究相比,本文提出的方法在处理亚组效应方面更具优势。相关研究包括“基于亚组的因果推断”和“因果聚类分析”。
沙发等你来抢
去评论
评论
沙发等你来抢