A Lightweight Attention-based Deep Network via Multi-Scale Feature Fusion for Multi-View Facial Expression Recognition

2024年03月21日
  • 简介
    卷积神经网络(CNNs)及其变体已经在面部表情识别(FER)中表现出有效性。然而,在处理真实世界场景中的高计算复杂性和多视角头部姿势时,它们面临挑战。我们引入了一种轻量级的注意力网络,其中包含多尺度特征融合(LANMSFF)来解决这些问题。针对第一个挑战,我们精心设计了一个轻量级的全卷积网络(FCN)。我们通过提出两个新颖的组件来解决第二个挑战,即质量注意(MassAtt)和点特征选择(PWFS)块。MassAtt块同时生成通道和空间注意力图,通过强调重要特征并抑制不相关的特征来重新校准特征图。另一方面,PWFS块采用特征选择机制,在融合过程之前丢弃不太有意义的特征。这个机制使它与之前直接融合多尺度特征的方法有所不同。我们提出的方法在参数数量和姿势变化鲁棒性方面取得了与最先进方法相当的结果,在KDEF、FER-2013和FERPlus数据集上的准确率分别为90.77%、70.44%和86.96%。LANMSFF的代码可在https://github.com/AE-1129/LANMSFF上获得。
  • 图表
  • 解决问题
    提出一种轻量级的注意力网络,用于解决面部表情识别中的高计算复杂性和多视角头部姿势的问题。
  • 关键思路
    使用轻量级全卷积网络(FCN)和两个新的组件(MassAtt和PWFS块)来实现多尺度特征融合和注意力机制,以提高模型的准确性和鲁棒性。
  • 其它亮点
    论文实现了与最先进方法相当的结果,准确率分别为KDEF数据集90.77%,FER-2013数据集70.44%和FERPlus数据集86.96%。代码已在Github上开源。
  • 相关研究
    最近的相关研究包括:'Facial Expression Recognition using 3D Convolutional Neural Networks','Facial Expression Recognition using Multi-Objective Deep Learning'等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论