Distributed OpenMP Offloading of OpenMC on Intel GPU MAX Accelerators

2024年03月05日
  • 简介
    蒙特卡罗(MC)模拟在各种科学和工程领域中发挥着重要作用,应用范围从核物理学到材料科学。利用高性能计算(HPC)系统,特别是图形处理器(GPU)的计算能力,已成为加速MC模拟的必要手段。本文重点介绍了OpenMC中子和光子输运蒙特卡罗代码在英特尔GPU上的适应和优化,具体是通过分布式OpenMP卸载实现在英特尔数据中心Max 1100 GPU(代号Ponte Vecchio,PVC)上的运行。在Tramm J.R.等人(2022)的先前工作奠定了GPU适应性的基础上,我们的研究将OpenMC代码的功能精心扩展到英特尔GPU上。我们提供了全面的基准测试和扩展分析,比较了英特尔MAX GPU和最先进的CPU执行(英特尔至强铂金8480+处理器,代号第四代Sapphire Rapids)的性能。结果表明,在计算负载增加时,与CPU执行相比,GPU适应代码展示了显著的加速因子,证明了其优于CPU的计算能力。
  • 作者讲解
  • 解决问题
    本论文旨在通过分布式OpenMP卸载将OpenMC中子和光子输运Monte Carlo代码适应和优化为英特尔GPU,特别是英特尔数据中心Max 1100 GPU(代号Ponte Vecchio,PVC),以加速MC模拟。
  • 关键思路
    本论文通过将OpenMC代码适应为英特尔GPU并进行分布式OpenMP卸载,实现了在英特尔MAX GPU上的优异性能,相较于英特尔Xeon Platinum 8480+处理器(代号第四代Sapphire Rapids)的CPU执行,加速因子明显。
  • 其它亮点
    本论文进行了全面的基准测试和扩展分析,展示了GPU适应代码相对于CPU的优越性能。实验使用了英特尔MAX GPU和英特尔Xeon Platinum 8480+处理器进行比较。
  • 相关研究
    最近的相关研究主要集中在使用GPU加速Monte Carlo模拟。例如,Tramm J.R.等人的工作为本论文的基础,但是本论文在适应和优化OpenMC代码方面进行了更深入的研究。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问