神经网络编译器全角度解读

近年来，以机器学习、深度学习为核心的AI技术得到迅猛发展，深度神经网络在各行各业得到广泛应用：

这些应用催生更多的新模型出现：CNN, RNN, LSTM, GAN, GNN，也催生着如Tensorflow, Pytorch, Mxnet, Caffe等深度学习框架出现。目前训练框架开始收敛，逐步形成了PyTorch引领学术界，TensorFlow主导工业界的一个双雄局面。

但是，深度学习算法要实现落地应用，必须被部署到硬件上，例如Google的TPU、华为麒麟NPU，各种AI专用芯片，FPGA等。这些各训练框架训练出来的模型要如何部署到不同的终端硬件呢，这就需要深度学习神经网络编译器来解决。

本文将对神经网络编译器的结构和原理进行阐述，并介绍几个相关的开源项目：TVM，Halide，AutoKernel，感兴趣的可以戳原文。

内容中包含的图片若涉及版权问题，请及时与我们联系删除