【标题】A Meta-Reinforcement Learning Algorithm for Causal Discovery

【作者团队】Andreas Sauter, Erman Acar, Vincent François-Lavet

【发表日期】2022.7.18

【论文链接】https://arxiv.org/pdf/2207.08457.pdf

【推荐理由】因果发现是一项对机器学习至关重要的主要任务,因为因果结构可以使模型超越纯粹的基于相关性的推理并显着提高其性能。 然而,从数据中找到因果结构在计算工作量和准确性方面都提出了重大挑战,更不用说如果没有一般干预是不可能的。 在本文中,作者开发了一种元强化学习算法,该算法通过学习执行干预来执行因果发现,这样它就可以构建一个明确的因果图。 除了对可能的下游应用程序有用之外,估计的因果图还为数据生成过程提供了解释。 在本文中展示了与 SOTA 方法相比,作者的算法估计出一个良好的图,即使在其潜在因果结构以前看不见的环境中也是如此。 此外,作者进行了一项消融研究,展示了学习干预如何有助于本文方法的整体表现。 最终得出结论,干预确实有助于提高绩效,有效地对可能看不见的环境的因果结构进行准确估计。

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除