识别他人的社会互动是人类的一项重要能力。以前的研究,即使用简单的刺激,表明社会互动是在颞上沟(STS)中被选择性地处理的,但以前的电影工作表明,社会互动是在内侧前额叶皮层(mPFC)中被处理的,这是心智理论网络的一部分。当控制其他共生的知觉和社会信息,如面孔、声音和心智理论时,在现实世界的刺激中观察到的社会互动选择性有多大仍是未知数。目前的研究利用fMRI和先进的预训练视觉卷积方法来揭示自然的社会互动感知所特有的大脑机制。我们分析了两个公开的在男性和女性参与者在MRI扫描仪中观看两种不同的商业电影时收集的fMRI数据集。通过进行像素编码和方差分割分析,我们发现广泛的社会情感特征可以预测社会脑区的神经反应,包括STS和mPFC。然而,只有STS对社会互动表现出强大而独特的选择性,与其他共变特征无关。这种选择性是在两个独立的fMRI数据集中观察到的。这些发现表明,自然的社会互动感知在STS中拥有专门的神经环路,与心智理论网络分开,是人类社会理解的一个关键维度。
社会互动感知指导着我们的日常行为,但我们的大脑如何处理现实世界的社会互动场景还不得而知。在这里,我们证明了社会性大脑区域,包括颞上沟(STS)和内侧前额叶皮层(mPFC),对自然电影中广泛的社会情感信息是敏感的,复制了先前控制范式的结果。然而,我们首次表明,STS,而不是mPFC,选择性地处理自然电影中的社会互动,而不依赖于其他共同出现的知觉和社会特征,包括运动、面孔的存在、语言和对他人的心智分析。我们的结果表明,社会互动感知是人类大脑中社会理解的一个重要维度。
上图A为像素编码模型概述。作者从参与者在核磁共振扫描仪中观看的一部电影中按时序标注了知觉和社会情感特征。这些特征包括色调、饱和度、每个像素的值、运动能量、是否有书面文字、室内与室外场景、是否有人脸、音频振幅、音调、是否有音乐、是否有社会互动、是否有代理人讲话、是否有代理人谈论他人的心理状态(心智理论)、感知的价值、以及两部电影的场景唤醒,另外还有夏季电影的社会触摸特征,同时本文还使用了使用ImageNet预训练的网络特征(DNN output)作为高维特征。在模型训练过程中,模型学习了一套β权重。然后,我们通过将电影特征向量乘以其相应的β权重来预测对未完成的电影数据的反应,并将这些预测与参与者观看电影时提取的实际反应联系起来。通过上述步骤,模型的预测性能分数被分配给每个像素。
图B为方差分割分析概述。来自完整模型、知觉模型和社会情感模型的预测性能r值被用来计算每个体素的知觉或社会情感模型所解释的独特方差。
上图显示了Sherlock(A和C)和Summer(B和D)两组数据中每个像素的最佳特征(面板A和B)和次佳特征(面板C和D)的偏好图。特征的颜色代表在底部显示。在这两项研究中,DNN特征最能解释整个大脑的神经反应,但STS除外,其神经反应最好由社会特征解释。总的来说,在这两项研究中,社会情感特征(绿色和紫色)在颞叶和额叶是最受欢迎的或至少是第二受欢迎的,而视觉特征(红色),除了DNN特征外,在视觉皮层也是最受欢迎的。
令人惊讶的是,包括上述许多社会情感区域在内的大部分大脑的首选特征是在物体识别任务中预先训练的DNN的第五层。Web et al的结论是,下层的DNN层可能在自然的视觉场景中捕获高水平的语义信息。需要进一步调查,以更好地了解后期DNN层在解释社会大脑活动中的实质性贡献。耐人寻味的是,DNN特征的最明显例外是对STS中社会互动的偏好。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢