- 简介线性求解器是广泛的决策支持和优化计算中的主要计算瓶颈。在异构硬件上,传统的稀疏数值线性代数方法通常效率低下,这种挑战变得更加明显。例如,解决病态线性系统的方法依赖于条件分支,这会降低在图形处理器(GPU)等硬件加速器上的性能。为了提高解决病态系统的效率,我们的计算策略将在GPU上高效的计算与需要在传统的中央处理器(CPU)上运行的计算分开。我们的策略最大化了昂贵的CPU计算的重复利用。迭代方法在我们的方法中发挥了重要作用,迄今为止,迭代方法在解决病态线性系统方面还没有被广泛使用。特别地,我们扩展了[1]中的思想,使用不精确的LU因子和灵活的广义最小残差(FGMRES)来实现迭代重构,以实现在GPU上的高效性能。我们关注的是在更广泛的应用环境中有效的解决方案,并讨论如何改进早期性能测试以更准确地预测在实际环境中的性能。
- 图表
- 解决问题提高解决病态线性系统的效率,尤其是在异构硬件上。
- 关键思路将有效的GPU计算与需要在传统CPU上运行的计算分离,最大程度地重复使用昂贵的CPU计算。使用迭代方法实现迭代细化,利用不精确LU因子和柔性广义最小残差(FGMRES)实现高效的GPU性能。
- 其它亮点实验展示了该方法在异构硬件上的高效性能。该方法可用于更广泛的应用场景,并讨论了如何改进早期性能测试以更准确地预测在实际环境中的性能。
- 近期的相关研究包括:[1]使用不完整LU分解的预处理方法;[2]使用并行计算的迭代方法;[3]使用深度学习方法解决线性系统。
沙发等你来抢
去评论
评论
沙发等你来抢