导语


内容简介
内容简介
主动推理(Active Inference),及其最近在部分可观察的马尔可夫决策过程(POMDPs)中的应用,为建模感知、学习和决策提供了统一的数学框架,该框架将这些心理过程及其相互作用视为相互依赖的推断形式。在主动推理中,决策智能体通过将先验信念与感觉输入结合起来,推断环境中不同外部状态和事件的概率,包括它们自己的行动。
不同于“被动”的感知推断过程(例如,根据光线模式对视网膜的影响来推断外部物体的存在),决策背后的推断是“主动的”,即智能体通过推断得出最可能产生偏好感觉输入的行动(例如,推断吃一些食物会减轻饥饿感)。智能体还通过推断得出最有可能减少不确定性并促进学习的行为(例如,推断打开冰箱将显示可用的食物选项)。这导致决策行为在最大化奖励和信息增益之间进行权衡。
主动推理预测的感知和行动模式与经验观察到的模式非常匹配。与主动推理相关的神经过程理论还成功地在多个研究范式中再现了经验观察到的神经反应,并产生了新颖的、可测试的预测。由于这些和其他考虑因素,这个框架在心理学、神经科学和机器学习领域近年来日益具有影响力。
本次读书会以论文《A step-by-step tutorial on active inference and its application to empirical data》为基础,从贝叶斯定理出发,引入变分推断方法进行近似贝叶斯推断,将感知建模为最小化变分自由能的过程,将行动建模为最小化期望自由能的过程。之后针对部分可观测马尔可夫决策过程通过因子图对其进行表示,并通过消息传播算法对信念进行更新。最后简要介绍主动推理框架在神经过程理论中的对应以及分层部分可观察马尔可夫决策过程。
内容大纲
内容大纲
主动推理简介
背景知识
概率论基础与生成模型
贝叶斯推断与变分推断
核心理论
变分自由能公式推导
期望自由能公式推导
实现及应用
图模型与消息传播
神经过程理论
扩展
分层马尔可夫决策过程
关键词
关键词
主动推理 Active Inference
贝叶斯定理 Bayes' theorem
变分自由能 Variational Free Energy (VFE)
期望自由能 Expected Free Energy(EFE)
部分可观测马尔可夫过程 Partially observable Markov decision process (POMDP)
因子图 Factor graph
消息传播 Message passing
神经处理理论 Neural process theory
主讲人简介
主讲人简介

直播信息
直播信息

参考文献
参考文献
• Smith, Ryan, Karl J. Friston, and Christopher J. Whyte. A step-by-step tutorial on active inference and its application to empirical data. Journal of mathematical psychology 107 (2022): 102632.
• Friston, K. The free-energy principle: a unified brain theory?. Nat Rev Neurosci 11, 127–138 (2010). https://doi.org/10.1038/nrn2787
推荐阅读
自由能原理与强化学习读书会招募中

点击“阅读原文”,报名读书会
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢