很多时候,机器学习系统过度专注于单个任务,并且它们可以在许多任务中表现出色。 这就是我们构建 Pathways 的原因——一种新的 AI 架构,可以同时处理多项任务、快速学习新任务并更好地理解世界。
Pathways 是一种新的人工智能思维方式,它解决了现有系统的许多弱点并综合了它们的优势。 为了向您展示我的意思,让我们来看看 AI 当前的一些缺点以及 Pathways 如何改进它们。
现在的 AI 模型通常被训练为只做一件事,Pathways 将使我们能够训练一个模型来做成千上万件事情。不仅可以处理许多单独的任务,而且可以利用和结合现有技能来更快、更有效地学习新任务。同时模型具有不同的功能,可以根据需要调用,并拼接在一起以执行新的、更复杂的任务——更接近哺乳动物大脑跨任务概括的方式。
现在的模型大多专注于一种形式的信息,Pathways 可以实现同时包含视觉、听觉和语言理解的多模态模型。因此,无论模型是在处理“豹”这个词,还是有人说“豹”的声音,还是豹奔跑的视频,都会在内部激活相同的反应:豹的概念。 结果是一个更有洞察力、更不容易出错和偏见的模型。
现在的模型密集且效率低下,Pathways 可以构建一个“稀疏”激活的模型,动态地学习网络的哪些部分擅长哪些任务。这样具有更大的学习各种任务的能力,而且速度更快、能源效率更高。
看上去Jeff Dean说的就是一种通用的多模态稀疏大模型。
今年8月,他曾经在TED上就此主题发表演讲(视频)。其中主要思想也是强调这一点:
在演讲中,他非常乐观地表示:“我们对此非常兴奋,这些对世界有更深刻了解的通用智能系统将真正使我们能够解决人类面临的一些最大的问题。例如,能够通过向这些模型注入化学和物理知识来设计更好的药物,能够通过提供更个性化的辅导来推进教育系统,能够解决气候变化这样非常复杂的问题,也许是开发清洁能源解决方案。”
智源社区微信群里讨论中,有同学反馈,Pathways Jeff Dean在Google内部已经说了两年,但细节仍然不清楚。
参考
- Jeff Dean原文: https://blog.google/technology/ai/introducing-pathways-next-generation-ai-architecture/
- 机器之心的报道: https://hub.baai.ac.cn/view/11169
- 8月Jeff Dean的TED演讲以及相关报道
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢