谷歌推出新型A3 GPU超级计算机虚拟机，支持大模型最高性能的训练

谷歌云宣布推出一款由英伟达H100 GPU驱动的新型A3 GPU超级计算机虚拟机，旨在为“当今的ML工作负载提供最高性能的训练”。

A3 GPU虚拟机旨在为当今的ML工作负载提供最高性能的训练，配有现代CPU、改进的主机内存、下一代Nvidia GPU和重大网络升级

具体来说，该公司正在用英伟达的H100 GPU武装这些机器，并将其与专门的数据中心相结合，以获得具有高吞吐量和低延迟的巨大计算能力，所有这些建议的价格都比您通常为此类软件包支付的更合理。

如果您正在寻找规格，请考虑它由8个Nvidia H100 GPU、第4代英特尔至强可扩展处理器、2TB主机内存和3.6 TB的双分带宽驱动，通过NVSwitch和NVLink 4.0，这两种Nvidia技术旨在帮助最大限度地提高多个GPU之间的吞吐量，如本产品中的GPU。

这些机器可以提供高达26 exaFlops的功率，这应该有助于增加与培训大型机器学习模型相关的时间和成本。此外，这些虚拟机上的工作负载在谷歌专门的Jupiter数据中心网络结构中运行，该公司将其描述为“26,000个高度互联的GPU”。这使“全带宽可重新配置的光学链路可以按需调整拓扑。”该公司表示，这种方法还应该有助于降低运行这些工作负载的成本。

这个想法是为客户提供大量动力，旨在训练更苛刻的工作负载，无论是涉及复杂的机器学习模型还是运行生成人工智能应用程序的LLM，并以更具成本效益的方式做到这一点。

目前只能通过注册预览候补名单来获得。

候补名单地址：

https://docs.google.com/forms/d/e/1FAIpQLSfWP2weHCBj9AliES43_TA0LO4oOaP5sbGDWWPSbe-NaBuxJA/viewform

内容中包含的图片若涉及版权问题，请及时与我们联系删除

谷歌推出新型A3 GPU超级计算机虚拟机，支持大模型最高性能的训练

评论列表

评论