Hugging Face, AWS partner on open-source machine learning amidst AI arms raceHugging Face,AWS 在人工智能军备竞赛中的开源机器学习合作伙伴

[机器翻译]

大型语言模型 (LLM)的令人印象深刻的进步显示出科技行业重大转变可能开始的迹象。AI 初创公司和大型科技公司正在寻找新颖的方法,将高级 LLM 用于从撰写电子邮件到生成软件代码的所有领域。 

然而,法学硕士的承诺也引发了科技巨头之间的军备竞赛。在努力建立自己的AI武器库的过程中,大型科技公司威胁要将该领域推向不那么开放、越来越保密的方向。

在这场竞争中,Hugging Face正在制定一项不同的战略,该战略将提供对开源AI模型的可扩展访问。Hugging Face 与 Amazon Web Services (AWS) 合作,以促进开源机器学习 (ML) 模型的采用。在高级模型越来越难以访问或隐藏在围墙花园后面的时代,一种易于使用的开源替代方案可以扩大应用机器学习的市场。

开源模型

虽然大规模机器学习模型非常有用,但设置和运行它们需要很少公司具备的特殊专业知识。Hugging Face 与 AWS 之间的新合作伙伴关系将尝试应对这些挑战。

开发人员可以使用亚马逊的云工具和基础架构轻松微调和部署来自 Hugging Face 的 ML 存储库的最先进模型。 

两家公司于 2021 年开始合作,在亚马逊基于云的机器学习平台 SageMaker 上引入了 Hugging Face深度学习容器 (DLC)。新的合作伙伴关系将把 Hugging Face 模型的可用性扩展到其他 AWS 产品和亚马逊基于云的 AI 加速器硬件,以加速训练和推理。

Hugging Face 产品总监 Jeff Boudier 告诉 VentureBeat:“自从我们开始在 SageMaker 中本地提供 Hugging Face 以来,使用量呈指数级增长,现在我们每个月都有 1,000 多名客户使用我们的解决方案。” “通过这种新的合作伙伴关系,我们现在正与为 AI 构建新型高效硬件的工程团队携手合作,例如 AWS Trainium 和 AWS Inferentia,以构建可直接在 Elastic Compute Cloud (EC2) 和 Elastic Kubernetes 上使用的解决方案服务(EKS)。”

人工智能军备竞赛

多年来,技术领导者一直在谈论机器学习的变革性质。但从未像过去几个月那样感受到这种转变。OpenAI 的 ChatGPT 语言模型的发布为 AI 霸主之争的新篇章奠定了基础。

微软最近向 OpenAI 投入了 100 亿美元,并正在努力将 LLM 集成到其产品中。谷歌已经向 OpenAI 的竞争对手 Anthropic 投资了 3 亿美元,并且正在努力保护其在线搜索帝国免受 LLM 支持产品的兴起。 

这些伙伴关系有明显的好处。在微软的资金支持下,OpenAI 已经能够在专用硬件上训练非常庞大且昂贵的机器学习模型,并将它们大规模部署到数百万人身上。Anthropic 还将通过其新的合作伙伴关系获得对 Google Cloud Platform 的特殊访问权限。

然而,大型科技公司之间的竞争也对该领域产生了影响。例如,自从与微软开始合作以来,OpenAI 停止了大部分机器学习模型的开源,并通过付费应用程序编程接口 (API) 为它们提供服务。它还被锁定在微软的云平台中,其模型只能在 Azure 和微软产品上使用。 

另一方面,Hugging Face 仍然致力于继续提供开源模型。通过 Hugging Face 和亚马逊之间的合作,开发人员和研究人员将能够部署开源模型,例如 BLOOMZ(GPT-3 替代方案)和 Stable Diffusion(DALL-E 2 的竞争对手)。

“这是开源机器学习领导者和云服务领导者之间的联盟,旨在共同构建下一代开源模型和使用它们的解决方案。我们共同构建的一切都将是开源的,并且可以公开访问,”Boudier 说。

Hugging Face 还旨在避免其他 AI 公司面临的那种锁定。虽然亚马逊仍将是其首选的云提供商,但 Hugging Face 将继续与其他云平台合作。

“这种新的合作伙伴关系不是排他性的,也不会改变我们与其他云提供商的关系,”Boudier 说。“我们的使命是让优秀的机器学习大众化,为此我们需要让用户随时随地使用我们的模型和库。我们将继续与微软和其他云合作,为世界各地的客户提供服务。”

公开透明

OpenAI 提供的 API 模型对于没有内部 ML 专业知识的公司来说是一个方便的选择。Hugging Face 也一直在通过其 Inference Endpoint 和 Inference API 产品提供类似的服务。但事实证明,API 对于希望更灵活地修改模型并将其与其他机器学习架构集成的组织来说是有限的。它们对于需要访问模型权重、梯度和训练数据的研究也不方便。

易于部署、可扩展的云工具(例如 Hugging Face 提供的工具)将使这些类型的应用成为可能。与此同时,该公司正在开发用于检测和标记 ML 模型的滥用、偏见和其他问题的工具。

“我们的愿景是开放和透明 [是] ML 的前进方向,”Boudier 说。“机器学习是科学驱动的,科学需要可重复性。易用性使最终用户可以访问所有内容,因此人们可以了解模型可以做什么和不能做什么,以及应该如何使用和不应该如何使用它们。”

内容中包含的图片若涉及版权问题,请及时与我们联系删除