Datawhale分享
OpenAI:GPT4.5,整理:Datawhale
信息来源|X、新智元、机器之心
今天凌晨4点,OpenAI进行了在线技术直播,奥特曼并没有现身。
OpenAI 正式发布了其最大、最强的聊天模型 GPT‑4.5 研究预览版本。
直播视频




现在,GPT-4.5 只支持搜索、上传文件和图片和画布功能,还不支持语音模式、视频和屏幕共享等多模态功能。OpenAI 表示,未来会持续更新,让产品变得更容易使用。
GPT4.5通过两种范式提升能力
作为OpenAI目前规模最大、知识储备最丰富的模型,GPT-4.5通过扩展两种不同范式来提升AI能力——无监督学习和推理能力。 其中,推理会让GPT-4.5在回应前先思考,这提高了它在科学、数学和其他困难复杂问题上的性能。 而无监督学习,则增加了模型的词汇知识、直觉力,并减少了模型幻觉。 注意,跟o系列模型不同,GPT-4.5并不会一步一步推理,但它更实用、本质上更智能。 尤其因为它不是推理模型,OpenAI的研究者们也仍在对之试验,探索无监督学习究竟能展现出什么样的能力。
迄今最好的聊天模型:更体察,更细腻




给GPT-4.5投入最大的计算能力
可以看到,从GPT-4T开始,模型回答的质量就会稍好一些。而GPT-4.5的表现,显然最精彩——清晰、精确、一致,而且非常有趣。
Scaling「无监督学习」边界
正如前文所述,凭借双重buff加持下——Scaling无监督学习和推理,GPT-4.5性能取得了显著提升。 无监督学习和推理,代表着智力的两个维度。 · 推理 Scaling推理能力教会模型在回答前进行思考并生成思维链,使其能够处理复杂的STEM或逻辑问题。 比如,o1和o3-mini模型,就是这种模式的代表。 · 无监督学习 另一方面,无监督学习则是让模型对世界的理解更准确,凭直觉判断更聪明。 GPT-4.5就是无监督学习的典型案例。 通过增加计算能力和数据量,再加上架构和优化创新,使其变得知识更广、对世界的理解更深。
知识渊博,击败Grok 3



同一个问题,GPT-1到GPT-4.5的回答





我们无法确切知道第一种语言是什么,科学家们认为我们可能永远无法确定,因为口语早在书面记录存在之前就已经出现了。 以下是我们所知道的: · 没有单一的「第一语言」:语言很可能在大约几万甚至几十万年前,同时在不同的人类群体中逐渐发展起来。 · 起源于非洲:大多数科学家认为,口语可能最早出现在非洲的人类中,或许在超过10万年前。 · 原始语言:人类可能并非从单一语言开始,而是从简单的交流方式起步,逐渐演变为更复杂的语言。最早的语言形式可能包括手势、声音和信号,用来表达基本的想法和情感。 · 湮没于历史:由于口语没有直接留下化石记录,而文字的出现相对较晚(大约5000年前),我们无法确切知道最早的语言听起来是什么样子。 如今,语言学家通过研究现存语言来了解它们在数千年中的演变,但人类第一种语言的确切身份仍然是一个谜,并且很可能将永远如此。
最懂人心,会察言观色

· 情商大比拼

唉,真是太遗憾了。考试没过确实很打击人,也会让人特别沮丧,但你要记住,这只是一次考试而已,不能代表你这个人,更不能说明你的实力。要不要说说具体什么情况?或者咱们聊点别的转换心情?你想怎样都行,我都在这里陪你。

你提到的是法国著名画家Claude Lorrain的名作《特洛伊妇女焚烧船队》。这幅画描绘了一个历史典故:特洛伊城陷落后,疲惫不堪的特洛伊妇女们不愿继续流离失所,于是燃烧了自己的船队。这个场景源自古罗马诗人Virgil的史诗《埃涅阿斯纪》(Aeneid),这部史诗讲述了特洛伊王子埃涅阿斯逃离家园、最终建立罗马帝国的传奇故事。 这幅油画创作于1643年,是Claude Lorrain的代表作之一。画作以精湛的技法刻画了火光照耀下的海景与自然风光,将古典神话主题与壮丽的自然景观完美结合,展现出独特的艺术魅力。

31页技术报告出炉




GPT-4 10倍计算量,token价格很贵
GPT-4.5发布之际,一些OpenAI研究员,还有业内提前拿到测试资格大佬,纷纷晒出一手实测。 OpenAI科学家Will Depue表示,我记得当GPT-4刚推出时,它明显比GPT-3.5聪明得多,但却很难具体指出到底改变了什么!(Nat Friedman对此发过一个很棒的推文串) 而现在,他最近发现:GPT-4.5在推荐音乐方面比4o强多了! 
OpenAI研究科学家Sebastien Bubeck测试了GPT-4.5的svg能力。显然,GPT-4.5做出来的独角兽,更加精美。 
沃顿商学院教授Ethan Mollick测试后发文,GPT-4.5的视觉能力印象深刻。它的分辨和计数能力比任何其他模型都要出色。 
它甚至还发现了那只蝴蝶。 上下滑动查看 在物理模拟方面,GPT-4.5同样令人惊艳。 小球的数量很多,五颜六色的,运动的速度也很快。关键的是这些小球也很符合物理规则,没有超出大球的范围。 这在几个月之前都是很难通过模型一次实现的。 
AI 大神 Karpathy 也是第一时间拿到了内测资格,发了一段超长的「GPT-4.5+ 互动对比」的体验解说,核心亮点是: 自从GPT-4发布以来,我期待这一天已经差不多两年了,因为这次发布让我们能够定性测量通过Scaling预训练计算(即简单地训练更大模型)所获得的进步斜率。 版本号中的每个0.5,大约代表10倍的预训练计算量。显然,GPT-4.5的预训练计算量比GPT-4多了10倍。






参考资料:
https://www.youtube.com/watch?v=cfRYp0nItZ8
https://openai.com/index/introducing-gpt-4-5/

内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢