LoAS: Fully Temporal-Parallel Datatflow for Dual-Sparse Spiking Neural Networks

简介

本文研究了稀疏权重下的脉冲神经网络（SNNs）的加速问题，着重于其核心操作——稀疏矩阵-稀疏矩阵乘法（spMspM）。作者发现，在现有的为稀疏人工神经网络（ANNs）设计的spMspM加速器上运行稀疏权重下的SNNs并不高效，主要原因是处理时间步会导致额外的循环，从而增加延迟和内存开销。为了解决这个问题，作者提出了一种完全时间并行（FTP）数据流，最小化时间步之间的数据移动和整个SNNs的延迟。为了最大化FTP数据流的效率，作者提出了一种FTP友好的脉冲压缩机制，能够高效压缩单比特脉冲并确保连续的内存访问。此外，作者还提出了一种FTP友好的内连接电路，可以降低昂贵的前缀和电路的成本，几乎没有吞吐量惩罚。所有这些FTP数据流的技术都被封装在LoAS中，这是一个用于双稀疏SNNs的低延迟推理加速器。使用FTP数据流、压缩和内连接，将双稀疏SNN负载在LoAS上运行，与先前的双稀疏加速器相比，表现出显著的加速（高达8.51倍）和能量降低（高达3.68倍）。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在研究加速稀疏双重稀疏脉冲神经网络（SNNs）的核心运算——稀疏矩阵乘法（spMspM），并提出一种全时并行（FTP）数据流以及相应的优化方法，以提高处理效率和降低能耗。
关键思路

论文提出了一种全时并行（FTP）数据流，通过压缩脉冲、优化内连接电路等方法，最小化跨时间步的数据传输和端到端延迟，从而提高了稀疏双重稀疏SNNs的处理效率和能耗表现。
其它亮点

论文的实验结果表明，使用FTP数据流、脉冲压缩和内连接电路等优化方法的LoAS处理器，与之前的双重稀疏加速器相比，在处理效率和能耗上都有了显著的提升。
相关研究

近期的相关研究包括：《Efficient Inference in Sparse Spiking Neural Networks using Compressed Axonal Projections》、《Efficient Inference in Fully-Connected Spiking Neural Networks with Sparse Convolutions and Separable Filters》等。

LoAS: Fully Temporal-Parallel Datatflow for Dual-Sparse Spiking Neural Networks

提问交流

提问交流