从机器学习的角度来看,谷歌比 Open AI 和微软有几个优势。
人工智能战争已经达到了一个新的水平。 谷歌宣布发布 Bard,这是他们对 ChatGPT 的回应。 谷歌首席执行官桑达尔·皮采 (Google Sundar Pichai) 在我们的人工智能之旅的重要下一步公告中发表了以下言论:

很快,您将在搜索中看到基于 AI 的功能,这些功能将复杂的信息和多个视角提炼成易于理解的格式,这样您就可以快速了解全局并从网络中了解更多信息:无论是寻找其他视角,例如既弹钢琴又弹吉他的人的博客,或深入探讨相关主题,例如作为初学者的入门步骤。 这些新的 AI 功能将很快开始在 Google 搜索中推出。

一些互联网评论员一直在评论谷歌推出这种模式是否太晚了。 既然微软已经开始将 ChatGPT 集成到他们的系统中,他们能否终结谷歌在搜索市场的霸主地位? 目前,围绕Bard的负面宣传很多,很多互联网知识分子预测,ChatGPT 将因其资历而独占鳌头。 Bard最近在其介绍中犯下的错误使情况更加复杂。

然而,纵观双方进行的 AI 研究,却呈现出截然不同的景象。 在本文中,我将介绍 Google 的 Bard 相对于 ChatGPT 的一些优势。 正如您将看到的,这些优势将很难克服。 最后,我还将介绍如何利用这种情况并从这场价值数十亿美元的 AI 军备竞赛中获益。

多模态

谷歌相对于 ChatGPT 的最大优势之一是谷歌人工智能系统的多模态能力。 简单地说,Bard 将远不止于一个语言模型。 它将语言、图像、声音等感官融为一体。 他们在文章《Introducing Pathways: A next-generation AI architecture》中介绍了他们的机器学习模型的 Pathways 训练系统——多模态功能具有很大的潜力。 综合来自多个来源的信息的能力意味着更深入、更丰富的最终输出。 它也可能被起诉以提高其产品的可访问性(你能想象实时翻译成不同的语言/手语)。 它还将释放智能手机的潜力,让我们更有可能通过视频和图片进行搜索。 这是我们已经可以在这段视频中看到的东西,谷歌的人工智能能够描述一张图片,甚至在出错时更新它的视图。

得益于在其搜索和 YouTube 上索引的内容,Google 已经拥有一个庞大的多模态信息库。 毫无疑问,ChatGPT 令人印象深刻。 它可以很好地解释概念。 但是你能想象当你给 Bard 代码时询问潜力,它可以帮助你可视化不同的组件吗? 多模式功能不仅增加了系统的实用性,而且使它们呈指数级增长。

我无法理解这有多重要,尤其是当我们将它与下一个优势结合起来时。

深度思维机器人

到目前为止,我已经看到数百人谈论 ChatGPT 和 Bard。 我还没有看到一个人提出这个问题。 可能是因为他们都被新事物分散注意力。

在上一节中,我介绍了谷歌一直在其 AI 中构建的多模式功能。 然而,这并不是谷歌及其子公司所取得的全部成就。 去年,DeepMind 发布了 GATO,它在众多任务中表现出了非凡的流畅性。

具有相同权重的同一个网络可以播放 Atari、字幕图像、聊天、用真实的机器人手臂堆叠块等等,根据其上下文决定是否输出文本、关节力矩、按钮按下或其他标记。

这让 Google 可以通过 ChatGPT 无法触及的方式将 Bard 和 ML 货币化。 物理代理具有一组独特的约束和挑战,ChatGPT 无法轻易将其转化为这些约束和挑战。 鉴于 Pathways 所围绕的一劳永逸的培训理念,Bard 很有可能拥有一些面向硬件的能力。 这让谷歌有机会通过其他收入来源获利,因为它们可以提供比 ChatGPT 更多的增值服务。

纯性能

人们还忽略了另一个因素,这个因素可能会决定性地让事情向谷歌有利的方向发展。 谷歌的模型明显更好。 一段时间以来,谷歌一直在多项任务的基准测试中名列前茅。

在大多数情况下,更好的基准性能是毫无意义的。 额外的 2-3% 的性能并不是一个巨大的差异。 但是,这里有两个重要的原因 :

如果谈到货币化,那么拥有更好的表现(即使只是微不足道的)是一个很好的营销工具。 如果我看到 Bard 比 ChatGPT 做得更好,那么我就不太可能为 ChatGPT 付费。

在谷歌的规模上,正确决策多出 2-3% 是一个很大的数字。 这将使事情朝着对巴德有利的方向发展。

这还有另一个因素。 谷歌在 2021-23 年取得了突破性进展。 他们在蛋白质建模、癌症、数学等方面取得了进步。 例如,他们革命性的“AlphaFold 可以准确预测蛋白质结构的 3D 模型,并且正在加速几乎所有生物学领域的研究”。

这超越了传统的深度学习。 Google 的 AI 博客有一篇名为“AutoML-Zero:Evolving Code that Learns”的文章使用 EA 来创建 ML 算法。 结果令人印象深刻,进化方法甚至优于强化学习。 这令人印象深刻。 以下是作者的引述:

“我们提出的方法称为 AutoML-Zero,它从空程序开始,仅使用基本的数学运算作为构建块,应用进化方法自动查找完整 ML 算法的代码。 鉴于小图像分类问题,我们的方法重新发现了基本的 ML 技术,例如研究人员多年来发明的具有反向传播、线性回归等的 2 层神经网络。 这一结果证明了自动发现更多新颖的 ML 算法以解决未来更困难的问题的可行性。”

将其与 ChatGPT 和 Open AI 进行比较。 虽然它令人印象深刻,但它并没有以同样的方式开创先河。 是的,微软的研究与谷歌一样出色。 但谷歌花了更长的时间将其各个分支机构整合到一个有凝聚力的系统中。 微软将不得不在这方面迎头赶上。 这很好地解释了下一点。

与产品集成

花点时间想一想你将如何通过 ChaGPT 获利。 在我关于微软的 Move on Open AI 的帖子中,我谈到了微软最有可能首先将 ChatGPT 与 MS Office 结合使用。 这是有道理的,因为这是一种风险非常低的入门方式,如果真的出现问题,他们不太可能失去客户。 这个预言成真了。

然而,这种低风险的方法也有不利的一面。 由于 MS 有效垄断了 Office 部门,因此添加更多功能不太可能让更多人使用他们的服务。 几乎任何需要 Teams 的人都拥有它,而且大多数公司实际上没有任何替代方案。 因此,通过整合它获得的额外收入不太可能是巨大的。

唯一的其他选择是构建新产品流/修改现有产品。 这将变得更加困难和昂贵。 鉴于 MS 可支配的资源,他们将能够完成这项工作。 然而,谷歌还有更长的时间将其集成到其各种产品中。 因此,它将有一个先发优势。 归根结底,Bard 的更多功能将使其比 ChatGPT 更具优势。 

内容中包含的图片若涉及版权问题,请及时与我们联系删除