论文链接:
https://openreview.net/forum?id=iATMbh8mhD&referrer=%5BTMLR%5D(%2Fgroup%3Fid%3DTMLR)
强化学习是解决不确定序贯决策问题的一种重要方法。尽管近几十年来取得了许多显著的成就,但在现实世界中应用强化学习方法仍然具有挑战性。其中一个主要障碍是强化学习智能体缺乏对世界的共同知识,因此必须通过大量的交互从头开始学习。他们也可能很难解释他们的决策和泛化学到的知识。另一方面,因果关系在形式化知识和利用结构不变性进行有效的知识转移方面具有明显的优势。这导致了因果强化学习的出现,这是强化学习的一个子领域,旨在使用数据生成过程的结构化和可解释表示来改进现有算法。本文全面回顾了因果强化学习的文献。首先介绍因果关系和强化学习的基本概念,然后解释因果建模如何解决非因果强化学习中的核心挑战。本文根据现有因果强化学习方法的目标问题和方法,对其进行了分类和系统回顾。最后,对该新兴领域存在的问题和未来发展方向进行了展望。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢