Nervana有一个称为Maxas的汇编代码生成器项目,可以生成性能超过nVidia官方版本的矩阵相乘的GPU机器码。其作者Scott Gray在代码外提供了详细的文档,值得说明的是Maxas使用的算法完全依赖于Maxwell架构的一些特性, 随着新一代GPU的架构的演进这个项目本身已经完全过时了,但其解决问题的思路仍然值得借鉴。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
举报类型(必选)
举报详情(选填)
0/200
沙发等你来抢
评论
沙发等你来抢