- 简介本文考虑了在大规模并行处理中使用非常小的矩阵的并行对称特征值求解器。我们定义了非常小的矩阵,以适应超级计算机每个节点缓存的大小,并假设这些大小也适应当前应用程序生产运行的 exa 级计算要求。为了最小化通信时间,我们增加了几个基于消息传递接口(MPI)非阻塞实现的通信避免和通信减少算法。在 FX10 系统的全节点上进行的性能评估表明:(1)MPI 非阻塞实现比基线实现高效 3 倍,(2)混合 MPI 执行比纯 MPI 执行快 1.9 倍,(3)我们提出的求解器比具有优化阻塞大小和循环-循环分布的 ScaLAPACK 例程分别快 2.3 倍和 22 倍。
-
- 图表
- 解决问题解决问题:本论文旨在设计一种适用于超级计算机的并行对称特征值求解器,解决大规模计算时的通信效率问题。
- 关键思路关键思路:论文采用了基于MPI非阻塞实现的通信避免和通信减少算法,以最小化通信时间。同时,通过将矩阵大小调整为符合超级计算机缓存大小和exa-scale计算要求的范围内,提高了计算效率。
- 其它亮点其他亮点:实验结果表明,MPI非阻塞实现比基线实现效率提高了3倍,混合MPI执行比纯MPI执行快1.9倍,所提出的求解器比ScaLAPACK常规优化算法快2.3倍至22倍不等。
- 相关研究:在这个领域中,最近的相关研究包括ScaLAPACK和其他基于MPI的特征值求解器。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流