pSTL-Bench: A Micro-Benchmark Suite for Assessing Scalability of C++ Parallel STL Implementations

2024年02月09日
  • 简介
    自从C++17标准模板库(STL)引入并行算法以来,STL已成为创建性能可移植应用程序的可行框架。鉴于多个现有的并行算法实现,系统的、定量的性能比较对于选择特定硬件配置的适当实现至关重要。 在本文中,我们介绍了一组专门的微基准测试,以评估STL中并行算法的可扩展性。通过选择不同的后端,我们的微基准测试可以在多核系统和GPU上使用。 通过使用这个套件,在AMD和Intel CPU以及NVIDIA GPU的案例研究中,我们能够识别出不同实现之间的重大性能差异,包括GCC+TBB、GCC+HPX、Intel的编译器与TBB,或者NVIDIA的编译器与OpenMP和CUDA。
  • 作者讲解
  • 图表
  • 解决问题
    评估C++ STL中并行算法的可扩展性和性能差异
  • 关键思路
    引入一组专门的微基准测试来评估STL中并行算法的可扩展性,通过选择不同的后端,可以在多核系统和GPU上使用微基准测试。通过在AMD和Intel CPU以及NVIDIA GPU上的案例研究,发现不同实现之间存在显著的性能差异。
  • 其它亮点
    使用了一组专门的微基准测试来评估STL中并行算法的可扩展性;能够在多核系统和GPU上使用微基准测试;通过实验发现不同实现之间存在显著的性能差异;
  • 相关研究
    没有提到相关的研究。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问