- 简介人群计数在城市规划、人群管理和公共安全等领域具有重要意义。本文介绍了一种新颖的注意力机制——傅里叶引导注意力(FGA),用于人群计数估计,旨在解决现有基于卷积的注意力网络中低效的全局模式捕捉问题。FGA利用快速傅里叶变换(FFT)结合全局特征的空间注意力和通道注意力的卷积处理半全局和局部特征,高效地捕捉多尺度信息,包括全尺度的全局模式。FGA的架构采用双通道方法:(1)通过FFT处理全尺度的全局特征,实现在频域中高效提取信息;(2)通过传统卷积和通道注意力处理剩余特征图,处理半全局和局部特征。这种双通道架构使FGA能够无缝地集成频率和空间信息,增强其捕捉不同人群模式的能力。我们将FGA应用于两个流行的人群计数模型CSRNet和CANNet的最后层,以评估该模块在ShanghaiTech-A、ShanghaiTech-B、UCF-CC-50和JHU ++ crowd等基准数据集上的性能。实验表明,在均方误差(MSE)和平均绝对误差(MAE)指标上,所有数据集的性能都有显著提高,表现与最近的最先进方法相当。此外,我们利用定性分析说明了FGA的可解释性,利用Grad-CAM热图展示了FGA捕捉人群模式的有效性。
- 图表
- 解决问题本文旨在解决人群计数中全局模式捕捉效率低下的问题,提出了一种新的注意力机制 Fourier-guided attention (FGA)。
- 关键思路FGA通过利用快速傅里叶变换(FFT)和空间注意力捕捉全局特征,利用通道注意力捕捉半全局和局部特征,实现了高效地捕捉多尺度信息,包括全局模式,并且能够无缝地整合频率和空间信息。
- 其它亮点实验结果表明,FGA在多个基准数据集上均有显著提高,具有与最新技术水平相当的性能。同时,通过定性分析,展示了FGA捕捉人群模式的有效性。
- 在人群计数领域,最近的相关研究包括:CSRNet、CANNet等。
沙发等你来抢
去评论
评论
沙发等你来抢