Distributed OpenMP Offloading of OpenMC on Intel GPU MAX Accelerators

2024年03月05日
  • 简介
    Monte Carlo(MC)模拟在多个科学和工程领域中起着关键作用,应用范围从核物理学到材料科学。利用高性能计算(HPC)系统,尤其是图形处理器(GPU)的计算能力,已经成为加速MC模拟的必要手段。本文重点研究了OpenMC中子和光子输运Monte Carlo代码在英特尔GPU上的适应和优化,特别是在分布式OpenMP卸载方面。在Tramm J.R.等人(2022)的先前工作的基础上,该研究将OpenMC代码的能力精细地扩展到英特尔GPU上。我们提供了全面的基准测试和扩展分析,比较了在英特尔MAX GPU上的性能与最先进的CPU执行(英特尔至强白金8480+处理器,代号第四代Sapphire Rapids)的性能。结果表明,在计算负载增加时,与CPU执行相比,GPU适应的代码展示了显著的加速因子,显示出其优于CPU的计算能力。
  • 图表
  • 解决问题
    本论文旨在将OpenMC中子和光子传输Monte Carlo代码适应和优化到Intel GPU上,特别是Intel Data Center Max 1100 GPU,通过分布式OpenMP卸载来加速MC模拟。研究比较了在Intel MAX GPU上的性能与最先进的CPU执行(Intel Xeon Platinum 8480+处理器,代号第四代Sapphire Rapids)。
  • 关键思路
    本论文通过将OpenMC代码适应和优化到Intel GPU上,利用GPU的计算能力来加速MC模拟,通过分布式OpenMP卸载来实现。
  • 其它亮点
    论文通过细致的实验设计,展示了GPU加速的OpenMC代码相较于CPU执行的加速效果,证明了GPU加速的优越性。论文还开源了代码,值得进一步研究。
  • 相关研究
    最近的相关研究包括Tramm J.R.等人的先前工作,以及其他利用GPU加速MC模拟的研究,如Brock S.等人的“GPU-accelerated Monte Carlo simulations for radiation transport in complex geometries”。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论