pSTL-Bench: A Micro-Benchmark Suite for Assessing Scalability of C++ Parallel STL Implementations

简介

自从C++17标准模板库（STL）引入并行算法以来，STL已成为创建性能可移植应用程序的可行框架。鉴于多个现有的并行算法实现，系统的、定量的性能比较对于选择特定硬件配置的适当实现至关重要。在本文中，我们介绍了一组专门的微基准测试，以评估STL中并行算法的可扩展性。通过选择不同的后端，我们的微基准测试可以在多核系统和GPU上使用。通过使用这个套件，在AMD和Intel CPU以及NVIDIA GPU的案例研究中，我们能够识别出不同实现之间的重大性能差异，包括GCC+TBB、GCC+HPX、Intel的编译器与TBB，或者NVIDIA的编译器与OpenMP和CUDA。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

评估C++ STL中并行算法的可扩展性和性能差异
关键思路

引入一组专门的微基准测试来评估STL中并行算法的可扩展性，通过选择不同的后端，可以在多核系统和GPU上使用微基准测试。通过在AMD和Intel CPU以及NVIDIA GPU上的案例研究，发现不同实现之间存在显著的性能差异。
其它亮点

使用了一组专门的微基准测试来评估STL中并行算法的可扩展性；能够在多核系统和GPU上使用微基准测试；通过实验发现不同实现之间存在显著的性能差异；
相关研究

没有提到相关的研究。