
新智元报道

新智元报道
【新智元导读】传说中的Gemini,终于在今天深夜上线了!「原生多模态」架构,是谷歌的史诗级创举,Gemini也如愿在多个领域超越了GPT-4。这场仗,谷歌必不能输。
谷歌的复仇大杀器Gemini,深夜忽然上线!
被ChatGPT压着打了整整一年,谷歌选择在12月的这一天,展开最强反击战。
多模态Gemini,迄今规模最大、能力最强的谷歌大模型,在文本、视频、语音等多个领域超越了GPT-4,是真正的一雪前耻。


多模态的史诗级创新
首次超越人类,大幅碾压GPT-4
虽然没有正式公布,但根据内部消息,Gemini有万亿参数,训练所用的算力甚至达到GPT-4的五倍。 既然是被拿来硬刚GPT-4的模型,Gemini当然少不了经历最严格的测试。 谷歌在多种任务上评估了两种模型的性能,惊喜地发现:从自然图像、音频、视频理解到数学推理,Gemini Ultra在32个常用的学术基准的30个上,已经超越GPT-4! 而在MMLU(大规模多任务语言理解)测试中,Gemini Ultra以90.0%的高分,首次超过了人类专家。


中杯、大杯、超大杯!

文本、图像、音频精准理解



复杂推理轻松搞定

AlphaCode 2:编码能力超85%人类选手




- 多个策略模型,用于为每个问题生成各自的代码样本; - 采样机制,能够生成多样化的代码样本,以在可能的程序解决方案中进行搜索; - 过滤机制,移除那些不符合问题描述的代码样本; - 聚类算法,将语义上相似的代码样本进行分组,以减少重复; - 评分模型,用于从10个代码样本集群中筛选出最优解。

更可靠、更高效、可扩展
对谷歌来说同样重要的是,Gemini显然是一个效率更高、更可靠、可扩展的模型。 它是在谷歌自己的张量处理单元上训练的,比谷歌以前的模型(如PaLM)运行起来更快、更便宜。 开发人员使用了谷歌内部研发的张量处理单元TPU v4和v5e,在AI优化的基础设施上对Gemini 1.0进行了大规模的训练。 而可靠、可扩展的训练模型和最高效的服务模型,就是谷歌做出Gemini的重要目标。 在TPU上,Gemini的运行速度明显快于早期规模较小、能力较弱的模型。这些定制设计的AI加速器是谷歌大模型产品的核心。 要知道,这些产品为搜索、YouTube、Gmail、谷歌地图、Google Play和Android等数十亿用户提供服务。它们还帮助了世界各地的科技公司经济、高效地训练大模型。 
除了Gemini,谷歌在今天还发布了迄今为止最强大、最高效,并且可扩展的TPU系统——Cloud TPU v5p,专为训练尖端的AI模型而设计。 新一代TPU将加速Gemini的发展,帮助开发人员和企业客户更快地训练大规模生成式AI模型,开发出新产品和新功能。 Gemini,让谷歌再次伟大?

Gemini,让谷歌再次伟大?
显然,在Pichai和Hassabis看来,Gemini的发布仅仅是一个开始——一个更大的项目即将开启。 Gemini是谷歌一直在等待的模式,在OpenAI和ChatGPT接管世界后,Gemini是谷歌探索一年得出的结论。 发布「红色警报」后,谷歌一直在追赶,但两人都表示,不愿意为了跟上步伐而走得太快,尤其是我们越来越接近AGI。 Gemini是否会改变世界?最好的情况是,它能帮谷歌在生成式AI竞赛中赶上OpenAI。 但劈柴、Hassabis等人似乎都认为,这是谷歌真正伟大的开始。 今天发布的技术报告,没有透露架构细节、模型参数或训练数据集。 艾伦人工智能研究所前CEO Oren Etzioni说,「没有理由怀疑Gemini在这些基准上比GPT-4更好,但没准GPT-5会比Gemini做得更好。」 打造像Gemini这样的巨量模型,可能需要花费数亿美元,但对于在通过云提供AI占据主导地位的公司来说,最终的回报可能是数十亿甚至数万亿美元。 「这是一场不能失败,必须打赢的战争。」 参考资料: https://blog.google/technology/ai/google-gemini-ai/#availability https://deepmind.google/technologies/gemini/#hands-on


内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢