几个月前谷歌强势推出了 TPUv4,并撰写论文讲述了研发团队的设计思路和从前几代 TPU 中吸取的经验。

论文链接:

https://www.gwern.net/docs/ai/2021-jouppi.pdf

当前,深度神经网络在商用领域的特定架构(DSA)已初步建立。该论文回顾了四代 DSA 的演变历程。生产经验推动了新设计的诞生,不再受限于 CPU 的缓慢发展和摩尔定律的衰退。

图 1:从 2015 年开始部署在谷歌数据中心的 3 个 TPU 的框图。

下表展示了几代 TPU 的关键特性,其中 TPUv4i 中 i 代表的是「推理」。

内容中包含的图片若涉及版权问题,请及时与我们联系删除