- 简介本文研究了稀疏权重下的脉冲神经网络(SNNs)的加速问题,着重于其核心操作——稀疏矩阵-稀疏矩阵乘法(spMspM)。作者发现,在现有的为稀疏人工神经网络(ANNs)设计的spMspM加速器上运行稀疏权重下的SNNs并不高效,主要原因是处理时间步会导致额外的循环,从而增加延迟和内存开销。为了解决这个问题,作者提出了一种完全时间并行(FTP)数据流,最小化时间步之间的数据移动和整个SNNs的延迟。为了最大化FTP数据流的效率,作者提出了一种FTP友好的脉冲压缩机制,能够高效压缩单比特脉冲并确保连续的内存访问。此外,作者还提出了一种FTP友好的内连接电路,可以降低昂贵的前缀和电路的成本,几乎没有吞吐量惩罚。所有这些FTP数据流的技术都被封装在LoAS中,这是一个用于双稀疏SNNs的低延迟推理加速器。使用FTP数据流、压缩和内连接,将双稀疏SNN负载在LoAS上运行,与先前的双稀疏加速器相比,表现出显著的加速(高达8.51倍)和能量降低(高达3.68倍)。
-
- 图表
- 解决问题本论文旨在研究加速稀疏双重稀疏脉冲神经网络(SNNs)的核心运算——稀疏矩阵乘法(spMspM),并提出一种全时并行(FTP)数据流以及相应的优化方法,以提高处理效率和降低能耗。
- 关键思路论文提出了一种全时并行(FTP)数据流,通过压缩脉冲、优化内连接电路等方法,最小化跨时间步的数据传输和端到端延迟,从而提高了稀疏双重稀疏SNNs的处理效率和能耗表现。
- 其它亮点论文的实验结果表明,使用FTP数据流、脉冲压缩和内连接电路等优化方法的LoAS处理器,与之前的双重稀疏加速器相比,在处理效率和能耗上都有了显著的提升。
- 近期的相关研究包括:《Efficient Inference in Sparse Spiking Neural Networks using Compressed Axonal Projections》、《Efficient Inference in Fully-Connected Spiking Neural Networks with Sparse Convolutions and Separable Filters》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流