PNAS速递｜第四代神经网络：树突计算模型

关键词：人工智能，神经网络，类脑计算，层级化模仿学习

论文题目：Beyond spiking networks: The computational advantages of dendritic amplification and input segregation
论文来源：PNAS
论文地址：https://www.pnas.org/doi/10.1073/pnas.2220743120

生物网络具有灵活支持各种不同功能的能力，并能以惊人的能量效率进行少样本学习。本研究提出由视觉L5层锥体神经元启发的神经网络及其学习算法。该网络具有传统人工神经网络网络无法企及的特性，其中包括无需错误传播进行学习的能力、可鲁棒地执行上下文相关任务，以及以层级化策略分解复杂长视距任务。

人工神经网络的组成元素——神经元——经历了四个阶段。这些阶段分别是：（1）最初的感知机：这是神经网络的起点，它基于线性加权累加，然而这种简单模型在处理复杂问题时存在局限。（2）现在我们最常使用的神经元模型增加了激活函数，使得神经元能够更好地处理非线性关系。（3）尖峰网络中的整合与激活：这一阶段涉及时间连续的波动，类似于神经元的尖峰活动，在处理时间相关的任务时非常有用。（4）本文提出的基于树突的模型，属于第四代人工神经元模型，具有更高的灵活性和适应性。

图1：四代人工神经元模型对比

从形态上来看（图2左），神经元包含细胞体（soma），其接收多个输入，也包含树突，可分为近端（apical prox）和远端（apical dist）。对其分区域建模，见图2右。

图2：锥体数据源的形态及分块最简模型

输入隔离（input segregation，即神经元在隔离区接收感觉信息和高阶反馈）以及非线性树突计算（nonlinear dendritic computation），将支持生物神经元的错误反向传播。然而，这些方法需要将具有精细时空结构的误差传播到所有神经元，而在生物网络中实现这一点可能并不容易。为了放宽这一假设，本研究认为尖峰（burst）和树突输入的分离为基于目标的学习提供了天然支持。这种学习传播的是目标信号，而不是预测误差。细胞体区和树突顶端区之间的重合机制允许产生高频尖峰。这种结构支持基于尖峰的学习规则，该规则基于教学信号触发的目标尖峰活动与递归连接引起的尖峰活动之间的比较，从而为基于目标的学习提供支持。

基于分段模型的学习规则如下：细胞体接收感官输入信息，远端接收环境信息或待学习的标签。当感官输入与标签在同一个时间窗口内出现时，神经元会在近端同时激活，将网络产生的近端尖峰与标签/上下文诱导的远端尖峰对齐，从而记住这两者之间的关联。学习完成后，网络能够自我维持近端活动，从而正确地再现由教学信号确定的目标。换句话说，即使教学信号不再存在，神经元也能够产生学习到的标签输入。（见图3）

图3：通过爆发介导的可塑性规则进行学习。

在模型验证过程中，任务为训练神经元网络记住三维空间中的路线。训练过程中，可加入上下文信息，例如在不同的背景下，记住不同的路径。

图4：神经元网络课鲁棒地在不同上下文环境下工作

该模型还可以进行层级化的模仿学习。该条件下任务为记住三维空间中，一条先按下绿色按钮，之后再走向食物（红色）的路径。具体方法为通过一个两级网络，其中高层神经元产生一个信号，作为低层网络的上下文，允许实现分层策略。在训练阶段，两个子网络接收两个不同的教学信号，以便模仿专家演示的分层策略。

图5：层级化模仿学习。

与第三代尖峰网络对比，在给定的背景输入包含更多噪音项时，多分段神经元获得奖励的比例没有显著下降，而单一神经元则会显著下降，这说明了模型在噪音下的鲁棒性。需要强调，这不是由于对策略采取了显式的分层，同一机制也存在于尖峰网络。之所以这样是由于尖峰网络缺乏输入隔离，导致网络对任务的表现不佳，降低了其对上下文噪声的鲁棒性，从而使其更容易受到子任务策略编码微小变化的影响。

图6：多分段神经元网络与第三代尖峰神经网络在层级化模仿任务上面对上下文噪音的性能对比

多分段尖峰神经元网络可用于高效（更少的神经元及对应的更低计算量及能耗）解决时空任务，如三维轨迹的上下文存储、调用及导航。该架构可以自然地协调“分层模仿学习”，从而将具有挑战性的长期决策任务分解为更简单的子任务，其中高级网络为低级网络提供上下文信号，从而具有上下文噪音鲁棒性。

编译｜郭瑞东

神经动力学模型读书会

详情请见：

500+神经动力学社区成员，邀你共同点亮更多脑科学研究的岛屿

推荐阅读

‍1. Nat. Mach. Intell.速递：在人工智能中结合神经启发的适应性进行持续学习

2. Nat. Commun. 速递：结合神经元仿真与人工智能的基于GPU的计算框架

3. 基于垫脚石原理的神经进化算法：为人工智能注入创造力

4. 张江：第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程

5. 成为集智VIP，解锁全站课程／读书会

6. 加入集智，一起复杂！

点击“阅读原文”，报名读书会

内容中包含的图片若涉及版权问题，请及时与我们联系删除

PNAS速递｜第四代神经网络：树突计算模型

评论