LoAS: Fully Temporal-Parallel Datatflow for Dual-Sparse Spiking Neural Networks

2024年07月19日
  • 简介
    本文研究了稀疏权重下的脉冲神经网络(SNNs)的加速问题,着重于其核心操作——稀疏矩阵-稀疏矩阵乘法(spMspM)。作者发现,在现有的为稀疏人工神经网络(ANNs)设计的spMspM加速器上运行稀疏权重下的SNNs并不高效,主要原因是处理时间步会导致额外的循环,从而增加延迟和内存开销。为了解决这个问题,作者提出了一种完全时间并行(FTP)数据流,最小化时间步之间的数据移动和整个SNNs的延迟。为了最大化FTP数据流的效率,作者提出了一种FTP友好的脉冲压缩机制,能够高效压缩单比特脉冲并确保连续的内存访问。此外,作者还提出了一种FTP友好的内连接电路,可以降低昂贵的前缀和电路的成本,几乎没有吞吐量惩罚。所有这些FTP数据流的技术都被封装在LoAS中,这是一个用于双稀疏SNNs的低延迟推理加速器。使用FTP数据流、压缩和内连接,将双稀疏SNN负载在LoAS上运行,与先前的双稀疏加速器相比,表现出显著的加速(高达8.51倍)和能量降低(高达3.68倍)。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在研究加速稀疏双重稀疏脉冲神经网络(SNNs)的核心运算——稀疏矩阵乘法(spMspM),并提出一种全时并行(FTP)数据流以及相应的优化方法,以提高处理效率和降低能耗。
  • 关键思路
    论文提出了一种全时并行(FTP)数据流,通过压缩脉冲、优化内连接电路等方法,最小化跨时间步的数据传输和端到端延迟,从而提高了稀疏双重稀疏SNNs的处理效率和能耗表现。
  • 其它亮点
    论文的实验结果表明,使用FTP数据流、脉冲压缩和内连接电路等优化方法的LoAS处理器,与之前的双重稀疏加速器相比,在处理效率和能耗上都有了显著的提升。
  • 相关研究
    近期的相关研究包括:《Efficient Inference in Sparse Spiking Neural Networks using Compressed Axonal Projections》、《Efficient Inference in Fully-Connected Spiking Neural Networks with Sparse Convolutions and Separable Filters》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问