Distributed OpenMP Offloading of OpenMC on Intel GPU MAX Accelerators

简介

Monte Carlo（MC）模拟在多个科学和工程领域中起着关键作用，应用范围从核物理学到材料科学。利用高性能计算（HPC）系统，尤其是图形处理器（GPU）的计算能力，已经成为加速MC模拟的必要手段。本文重点研究了OpenMC中子和光子输运Monte Carlo代码在英特尔GPU上的适应和优化，特别是在分布式OpenMP卸载方面。在Tramm J.R.等人（2022）的先前工作的基础上，该研究将OpenMC代码的能力精细地扩展到英特尔GPU上。我们提供了全面的基准测试和扩展分析，比较了在英特尔MAX GPU上的性能与最先进的CPU执行（英特尔至强白金8480+处理器，代号第四代Sapphire Rapids）的性能。结果表明，在计算负载增加时，与CPU执行相比，GPU适应的代码展示了显著的加速因子，显示出其优于CPU的计算能力。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在将OpenMC中子和光子传输Monte Carlo代码适应和优化到Intel GPU上，特别是Intel Data Center Max 1100 GPU，通过分布式OpenMP卸载来加速MC模拟。研究比较了在Intel MAX GPU上的性能与最先进的CPU执行（Intel Xeon Platinum 8480+处理器，代号第四代Sapphire Rapids）。
关键思路

本论文通过将OpenMC代码适应和优化到Intel GPU上，利用GPU的计算能力来加速MC模拟，通过分布式OpenMP卸载来实现。
其它亮点

论文通过细致的实验设计，展示了GPU加速的OpenMC代码相较于CPU执行的加速效果，证明了GPU加速的优越性。论文还开源了代码，值得进一步研究。
相关研究

最近的相关研究包括Tramm J.R.等人的先前工作，以及其他利用GPU加速MC模拟的研究，如Brock S.等人的“GPU-accelerated Monte Carlo simulations for radiation transport in complex geometries”。

Distributed OpenMP Offloading of OpenMC on Intel GPU MAX Accelerators

提问交流

提问交流