- 简介自从C++17标准模板库(STL)引入并行算法以来,STL已成为创建性能可移植应用程序的可行框架。鉴于多个现有的并行算法实现,系统的、定量的性能比较对于选择特定硬件配置的适当实现至关重要。 在本文中,我们介绍了一组专门的微基准测试,以评估STL中并行算法的可扩展性。通过选择不同的后端,我们的微基准测试可以在多核系统和GPU上使用。 通过使用这个套件,在AMD和Intel CPU以及NVIDIA GPU的案例研究中,我们能够识别出不同实现之间的重大性能差异,包括GCC+TBB、GCC+HPX、Intel的编译器与TBB,或者NVIDIA的编译器与OpenMP和CUDA。
-
- 图表
- 解决问题评估C++ STL中并行算法的可扩展性和性能差异
- 关键思路引入一组专门的微基准测试来评估STL中并行算法的可扩展性,通过选择不同的后端,可以在多核系统和GPU上使用微基准测试。通过在AMD和Intel CPU以及NVIDIA GPU上的案例研究,发现不同实现之间存在显著的性能差异。
- 其它亮点使用了一组专门的微基准测试来评估STL中并行算法的可扩展性;能够在多核系统和GPU上使用微基准测试;通过实验发现不同实现之间存在显著的性能差异;
- 没有提到相关的研究。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流