- 简介稀疏矩阵乘法(SpGEMM)是许多领域中的关键操作,包括科学计算、图形分析和深度学习。这些应用利用矩阵的稀疏性来减少存储和计算需求。然而,稀疏矩阵的不规则结构对性能优化提出了重大挑战。传统的硬件加速器针对特定的稀疏模式设计了固定的数据流方案 - 内部、外部和逐行,但当实际稀疏度偏离这些预定模式时,它们往往表现不佳。随着SpGEMM在各个领域的使用扩大,每个领域都具有不同的稀疏特征,因此需要能够高效处理一系列稀疏模式的硬件加速器。本文提出了一种基于机器学习的方法,用于自适应选择适合不同稀疏模式的SpGEMM任务的最合适的数据流方案。通过采用决策树和深度强化学习,我们探索了这些技术在识别最优数据流方案方面超越启发式方法的潜力。我们通过将模型的性能与启发式方法进行比较来评估我们的模型,突出了每种方法的优缺点。我们的研究结果表明,在硬件加速器中使用机器学习进行动态数据流选择可以提供高达28倍的增益。
- 图表
- 解决问题解决稀疏矩阵乘法中数据流选择问题,以适应各种不同的稀疏性模式,提高硬件加速器的性能。
- 关键思路使用决策树和深度强化学习的机器学习方法,自适应地选择最合适的数据流方案,以提高稀疏矩阵乘法的性能。
- 其它亮点论文通过比较机器学习方法和启发式方法的性能,发现使用机器学习方法可以带来高达28倍的性能提升。实验使用了不同的数据集,并提供了开源代码。
- 最近的相关研究包括:'Efficient Sparse-Dense Matrix Multiplication for Deep Neural Network','Accelerating Sparse Matrix-Vector Multiplication on GPUs'等。
沙发等你来抢
去评论
评论
沙发等你来抢