谷歌云宣布推出一款由英伟达H100 GPU驱动的新型A3 GPU超级计算机虚拟机,旨在为“当今的ML工作负载提供最高性能的训练”。

A3 GPU虚拟机旨在为当今的ML工作负载提供最高性能的训练,配有现代CPU、改进的主机内存、下一代Nvidia GPU和重大网络升级

具体来说,该公司正在用英伟达的H100 GPU武装这些机器,并将其与专门的数据中心相结合,以获得具有高吞吐量和低延迟的巨大计算能力,所有这些建议的价格都比您通常为此类软件包支付的更合理。

如果您正在寻找规格,请考虑它由8个Nvidia H100 GPU、第4代英特尔至强可扩展处理器、2TB主机内存和3.6 TB的双分带宽驱动,通过NVSwitch和NVLink 4.0,这两种Nvidia技术旨在帮助最大限度地提高多个GPU之间的吞吐量,如本产品中的GPU。

这些机器可以提供高达26 exaFlops的功率,这应该有助于增加与培训大型机器学习模型相关的时间和成本。此外,这些虚拟机上的工作负载在谷歌专门的Jupiter数据中心网络结构中运行,该公司将其描述为“26,000个高度互联的GPU”。这使“全带宽可重新配置的光学链路可以按需调整拓扑。”该公司表示,这种方法还应该有助于降低运行这些工作负载的成本。

这个想法是为客户提供大量动力,旨在训练更苛刻的工作负载,无论是涉及复杂的机器学习模型还是运行生成人工智能应用程序的LLM,并以更具成本效益的方式做到这一点。

目前只能通过注册预览候补名单来获得。

候补名单地址:

https://docs.google.com/forms/d/e/1FAIpQLSfWP2weHCBj9AliES43_TA0LO4oOaP5sbGDWWPSbe-NaBuxJA/viewform