OpenAI 最近操作不断,Sora App、Dev Day 的密集发布、与 Nvidia、AMD 的各种协议合作等等。

很明显,在 ChatGPT 和基础模型之外,他们想要更多。

我们的目标并不是做「超级 App」,而是要构建一个真正强大的 AI 超级系统。

在 a16z 最近的访谈中,Sam Altman 描述了他们的目标:一个集前沿研究、超大规模基础设施和消费级产品于一体的超级系统。

一个人人会使用的个人 AI 订阅服务,用户不仅能在 OpenAI 的消费产品里使用它,还能用它登录许多其他服务,未来某个时候,还可以通过专用硬件来使用它。

一个无处不在的 ChatGPT,一个整合了产品、基础设施和硬件的超级公司。

访谈中,Altman 还分享了很多他对于业务的实际思考,包括对于不同业务的底层逻辑思考、现在的产品策略是什么、为什么要做 AI 基建、Sora 的盈利模式、对于 agent 的看法等等。

  • Apps 和 ChatGPT 的结合非常棒。未来,开发者会找到一种非常适合他们的新分发机制。

  • iPhone 就是一个垂直整合的例子。我认为 iPhone 是科技行业有史以来最了不起的产品,而且它实现了极高的垂直整合度。

  • 关于护城河,我觉得没有通用的「最佳答案」。我的回答是:你找到了一些,只对你当前产品、技术、市场定位在这个时间点上才成立的独特东西。而这类东西,往往构成了你能创造巨大价值的核心。

  • 社会与技术必须共同演进。你不能等到最后把一个完美的东西直接扔给世界,这行不通。它必须是一个持续的、相互适应的过程。

  • Sora 的一个很酷的地方在于解锁了未来的交互方向,未来的交互界面可能是一个由 AI 实时渲染出来的动态视频世界。


超 14000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

OpenAI 的方向:

做一家垂直整合的 AGI 公司

主持人:在 2025 DevDay 上,你对发布的哪部分内容最感兴趣?

Sam Altman:所有。非要说一个重点,是 App 和 ChatGPT 的结合。

但我觉得我们还需要一些迭代,来摸索出人们真正想怎么用这些东西。比如:用户到底更倾向于通过调用某个应用来完成任务,还是希望 ChatGPT 本身就知道他们想干什么并主动推荐?我认为,开发者最终会找到一种新的分发机制,非常适合他们。但说到底,这些产品推向世界后,总是会带来一些意想不到的惊喜。

主持人:OpenAI 现在很复杂,是一个消费级科技公司,一个 scaling 的 infra 运营商,一个 research lab,还有硬件,应用商店等等。OpenAI 到底想做什么?

Sam Altman:是的,可以看作是三家公司,或者说,第四部分是我们以自己的方式打造的、一个规模庞大的研究实验室。但核心业务主要有三个。我们希望成为人们的个人 AI 订阅服务,我认为大多数人都会订阅一个,有些人可能会订阅好几个。你不仅能在我们自家的消费产品里使用它,还能用它登录许多其他服务,未来某个时候,你还可以通过专用硬件来使用它。最终,你会拥有一个真正了解你、并且对你非常有用的 AI,这就是我们想做的。事实证明,为了支撑这一切,我们还必须建设海量的基础设施。但这套基础设施的目标,或者说我们真正的使命,始终是「AGI,并使其对全人类有益」。

主持人:你们的基础设施未来会成为一项独立业务,还是只服务于个人 AI订阅这个核心目标?

Sam Altman:你是说,我们会不会把基础设施作为服务卖给其他公司?直觉上,它未来可能会衍生出一些别的用途,但我们目前还没有明确的计划。目前我们的计划只是支持我们想要提供的服务和研究。

主持人:在 ChatGPT 还没有出现的时候,你开玩笑说 OpenAI 的商业模式要去问 AI,现在看,这句玩笑话是不是比我们想象的更认真?

Sam Altman:那句话并不完全是玩笑但我们确实有好几次,包括最近一次,向当时最新的模型询问我们应该怎么做,它都给出了我们自己没注意到、但很有洞察力的答案。能实现的关键在于你得给它足够多的背景信息。

所以,当我那么说的时候,大家可能只把它当成一句趣话,但其实它既有玩笑的成分,也有认真的成分。

主持人:除了扩大分发和算力之外,连接这些不同业务的底层逻辑是什么?

Sam Altman:研究让我们能做出伟大的产品,而基础设施让我们能进行研究。所以它就像一个垂直整合的技术栈。你可以用 ChatGPT 或其他服务来获取建议,但要让它有效,背后需要前沿的研究和大量的基础设施。所以,它们其实是一回事。

我过去一直反对垂直整合,但现在我觉得我可能错了。人们总希望经济是高效的,理论上公司应该只做一件事,然后与其他公司协作。但在我们的案例中,至少目前看来并不是这样的。OpenAI 的发展经历告诉我们,为了实现我们的使命,我们必须做比最初想象中更多的事情。

iPhone 就是一个垂直整合的例子。我认为 iPhone 是科技行业有史以来最了不起的产品,而且它实现了极高的垂直整合度。


02 

OpenAI 不想做「超级 App」

主持人:谈谈你们的产品战略。最终是想打造一个无所不包的「超级应用」,还是一个由多个应用构成的「超级系统」?

Sam Altman:我们的目标并不是做「超级 App」,而是要构建一个真正强大的 AI 超级系统。

Sora 作为一个独立的应用发布,而不是集成到 ChatGPT 里,是因为对很多用户来说,ChatGPT 是他们最私人的账号之一。如果把一个「社交体验」也强行塞进去,感觉会很奇怪。你可以想象加入一些「消息」功能,因为很多人确实会分享内容、进行协作。但从用户心态来看,他们对 ChatGPT 的认知,和对一个娱乐类 App 的认知是完全不同的,混在一起会有割裂感。当然,我们也会把很多功能直接加到 ChatGPT 里,但有些东西还是更适合独立发布。

主持人:你觉得现在人们可以构建哪些真正重要、有用的 Agent?你最看好哪一类?

Sam Altman:我觉得可以参考一下 Codex 的发展,然后把这种思路推广到其他行业。比如:能不能为法律、金融建模,或其他我们已经看到早期成功案例的领域,打造像 Codex 一样的体验?其实现在已经有一些很棒的初创公司在做这些方向了。随着技术的成熟,如果你能让这些 Agent 在各自行业中,做到像 Codex 在编程领域那样强大,那将是我最感兴趣的方向之一。

想象一下未来的场景:一个人只需要和一堆 Agent 对话,就能启动一个公司。现在的 Agent Builder 和 AgentKit 还没完全达到这个水平,但我能看到我们正在往这个方向靠近。

主持人:聊回你之前提的「一人十亿美元公司」赌局。距离一个能真正独立干完一周工作、完全不用人操心的 Agent,还有多远?

Sam Altman:我觉得,像 Code Interpreter(代码解释器)这样的工具,距离完成「一周的工作量」其实已经不远了。虽然听起来有点疯狂,但我觉得这并不是一个遥不可及的 2025 年目标。

我和一些人聊起这事,他们也很惊讶地说:「它现在真的已经能完成一天的任务了?怎么发展得这么快?」老实说,我通常不会觉得 AI 的进步有多夸张,但在 ChatGPT Code Interpreter 能完成的任务长度这个方面,我真的感受到一种爆炸式的进展。所以我猜,一周级别的任务,可能真的很快就能实现。

主持人:要实现这种 Agent,还需要哪些技术上的突破?

Sam Altman:更聪明的模型、更长的上下文处理能力、更好的记忆系统。

主持人:AI 极大地降低了开发门槛,你认为初创公司真正的护城河(moat)在哪里?是数据、分发,还是独特的工作流?

Sam Altman:我觉得挺难回答的。我认为最好的「独特优势」,往往是你自己为你要做的事情量身打造的。我们在 OpenAI 也花了很多精力去找到这一点。我觉得这没有通用的「最佳答案」。最好的回答应该是:你找到了一些,只对你当前产品、技术、市场定位在这个时间点上才成立的独特东西。而这类东西,往往就构成了你能创造巨大价值的核心。

不过,有一点通用的建议我可以说:你是在做的过程中逐步发现优势的。我很喜欢一句经典的商业名言,「让战术变成战略。」你可以先从一些「有用、能跑得通的事情」开始,往往在这个过程中,就会慢慢浮现出某些可以上升为战略的东西。如果你在我们刚开始做 ChatGPT 的时候问我:「你们未来会有什么持久的优势?」我可能会说「我也不知道」,或者给你一堆猜测,但不会有特别自信的答案。但现在回头看,像「记忆」功能,其实就成为了一个非常强的竞争优势,也是用户持续使用 ChatGPT 的重要原因之一,但当时我们压根没想到这点。所以你在构建功能时,有时会意外地发现:「哇,这个点其实可以成为我们长期的护城河。」这就是你一边走、一边找、慢慢形成的过程。

主持人:如果我们站在 GPT-6 的时代回望今天,你认为什么样的产品决策,能让应用经受住时间的考验?

Sam Altman:最终还是得你自己去摸索出来。我觉得 AI 虽然改变了世界上很多事情,但它并没有改变一个公司获得优势的底层机制。比如说,网络效应、品牌和市场优势、用户数据、平台或市场的双边效应等等,这些因素过去行得通,现在依然有效。如果你去列一个近几年成功企业的清单,那些驱动力大概率现在也还适用。只不过,现在可能会有一些新的策略、新的打法。


03 

疯狂推进 AI基建

继续做产业链整合

主持人:作为 CEO,你最近和 AMD、Oracle 等公司达成了一系列合作。与早年相比,你在达成这些交易时的思路有什么变化?

Sam Altman:我那时确实没什么运营和管理经验。我天生不是那种适合经营公司的人,更擅长做投资。我之前就是干这个的,也一度以为那就是我的职业方向了。

我在那之前也当过 CEO,但当得不好。所以我认为,在做那笔交易时,我的心态更像一个为公司提供建议的投资者。而现在,我明白了真正运营一家公司是什么感觉。我花了很多时间才学会怎么把一笔交易真正在运营层面落地,怎么去考虑协议背后所有的连锁反应,而不仅仅是盯着「拿到钱和渠道」这么简单。

主持人:你们既与这些公司合作,也存在潜在的竞争关系。你是如何决定何时合作、何时竞争的?

Sam Altman:我们已经下定决心,是时候进行一次非常激进的基础设施投资了。因为我对我们未来的研究路线图,以及这些新模型能创造的经济价值,从未像现在这样充满信心。但要在如此大的规模上进行投资,我们需要整个行业,或者说行业里的一大批关键角色来共同支持。这涉及到从最底层的硬件(electrons)到最上层的模型分发,以及中间所有环节。因此,我们会和非常非常多的人合作。在未来几个月,你会看到我们在这方面有更多动作。

主持人:当你谈到扩张规模时,似乎没有上限。在你看来,限制 OpenAI 规模的因素是什么?

Sam Altman:上限肯定是有的。比如全球的 GDP 就是一个硬上限,其中知识型工作又只占一部分,而且我们目前还没涉足机器人领域。所以限制是客观存在的,但感觉这些限制离我们今天的水平还非常遥远。如果我们对模型能力发展方向的判断是正确的,那么它能释放的经济价值就有极大的想象空间。如果你只有今天的模型,当然不会按那个规模去扩张。不过,即便如此我们还是会继续扩张,因为我们能清楚地看到,仅凭现有模型,就有大量需求我们无法满足。但如果我们只有今天的模型,我们不会如此激进地扩张。是因为我们看到的不仅仅是今天的模型,我们能比市场提前一两年看到未来

主持人:哪些投入是为了实现 AGI,哪些又是为了对冲不确定性的?

Sam Altman:表面上看,Sora 似乎与 AGI 不太相关。但我敢打赌,如果我们能构建出非常出色的世界模型,它对 AGI 的重要性将远超人们的想象。

这和 ChatGPT 的情况很像。当初也有很多人觉得它离 AGI 很远,但它却给我们带来了巨大的帮助:不仅让我们能训练出更好的模型,也让我们第一次真正了解社会想怎么用这项技术,更重要的是,它迫使整个社会开始认真对待 AGI。在 ChatGPT 出现前的很长一段时间里,我们谈论 AGI,人们要么觉得这不可能发生,要么根本不关心。是 ChatGPT 的出现,才让大家突然开始关心这件事。

所以,撇开研究上的好处不谈,我坚信,社会与技术必须共同演进。你不能等到最后把一个完美的东西直接扔给世界,那行不通。它必须是一个持续的、相互适应的过程。

主持人:你曾说过,在职业上你最关心的两件事是 AI 和能源。现在这两者是如何融合在一起的?

Sam Altman:我当时并不知道它们最终会成为同一件事。它们原本是两个独立的兴趣,但现在确实融合在一起了。 回顾历史,改善人们生活质量最具影响力的因素就是更廉价、更丰富的能源。所以,进一步推动能源发展是个好主意。每个人看世界的角度不同,而在我的视角里,能源无处不在。

主持人:随着 AI 对能源需求的激增,你认为未来的能源结构会是怎样的?政策上应该如何应对?

Sam Altman:我预计短期内,美国新增的基荷电力主要会来自天然气。但长期来看,我相信主导能源将是太阳能加储能以及核能的某种组合。具体比例不好说,但这两种会是未来的主力。这包括了先进的裂变技术、小型模块化反应堆(SMRs)以及核聚变等整个技术方向。


04 

发布 Sora 2 的目的是「共同演进

主持人:Sora 在你们的战略中扮演什么角色?为什么要把宝贵的 GPU 资源投入到 Sora 上,这是一种长短期的权衡吗?

Sam Altman:Sora 有几个层面的意义。

首先,能做出人们喜欢的好产品,本身就是一件很酷的事。

其次,也是更重要的一点,这正是我所说的「共同演进」:让社会提前感受即将到来的技术。很快,世界就必须面对强大的视频模型,它们能深度伪造任何人,能生成任何你想要的画面。这大部分是好事,但社会也需要一个适应期。就像 ChatGPT 一样,我们觉得世界需要了解这项技术的发展方向。我认为让世界尽快了解视频技术的发展方向非常重要,因为视频比文本更具情感共鸣力,很快我们将进入一个视频无处不在的世界。

除此之外,就像我前面提到的,Sora 对我们的研究计划有帮助,也是通往 AGI 路上的一部分。而且话说回来,AI 的意义也不该只是追求极致的效率、解决所有问题。这条路上也应该有乐趣、喜悦和创造力。当然,我们不会把海量的算力都投给它,Sora 只占了我们总算力的一小部分而已。

主持人:你曾说模型已经让聊天这个应用场景饱和了。未来的 AI 人机交互,在软硬件上会是什么样的?

Sam Altman:我需要澄清一下,我当时说「聊天」饱和,指的是一个很窄的范围:如果你只是想进行简单的日常对话,那现在的模型确实已经很好了。但是,作为一个交互界面,「聊天」的潜力还远没有达到饱和。比如,你可以对聊天界面说:「请治愈癌症。」模型显然还做不到。

所以我认为,文本交互这种形式还有很长的路要走,即便对于闲聊类的应用,模型已经很出色了。当然,未来肯定还会有更好的交互界面出现。

Sora 的一个很酷的地方在于,想象一下,未来的交互界面可能是一个由 AI 实时渲染出来的动态视频世界。这会解锁多少可能性?另外,你也可以想象新型的硬件设备,它们能时刻感知周围环境的状况。你的手机不会再随时用短信通知来打扰你,而是能真正理解你的处境,知道在什么时候向你展示什么内容。所有这些都还有很长的路要走。


05 

Sora 的盈利模式可能是按次收费

主持人:关于盈利模式,你目前最关心或者正在探索的方向是什么?

Sam Altman:我现在最关心的是 Sora 的盈利模式,因为它刚刚发布,使用量非常大。发布这种产品总能让你学到一件事:用户实际用它的方式,和你最初设想的差别有多大。大家当然在用我们预想的方式使用 Sora,但同时也出现了大量我们没想到的用法,比如生成自己和朋友的搞笑表情包,然后在群聊里分享。这需要一种非常不同的盈利模式。

Sora 视频的制作成本很高。对于每天生成几百次的用户来说,这将需要一种与我们原先设想的完全不同的盈利方式。Sora 背后有一个很酷的假设,那就是人们其实有强烈的创作欲望,并不是传统互联网理论里说的只有 1% 的人创作。可能只是过去的工具门槛太高了。我觉得这是个非常棒的转变,但这也意味着我们必须为这种高频的创作行为,找到一种全新的、可持续的盈利模式。我猜,对于这种高成本的生成,可能最终还是得按次收费。

主持人:对于长尾用户,你考虑过广告变现吗?

Sam Altman:持开放态度。和许多人一样,我觉得广告有点令人讨厌,但并非完全不可行。有些广告我甚至很喜欢,比如我很赞赏 Meta 的一点是,Instagram 的广告对我来说常常是加分项,我确实喜欢看。人们对 ChatGPT 有着非常高的信任关系,即使它出错、产生幻觉,人们也觉得它在努力帮助他们,做正确的事。如果我们破坏了这种信任,比如当用户问「我该买哪款咖啡机?」时,我们推荐的不是最好的,而是付了钱给我们的一款,那么这种信任就会消失。所以那种广告是行不通的。但我能想象到其他一些类型的广告是完全可行的,只是在设计上必须极其小心,避免踩进那些明显的坑里。

主持人:你怎么看版权问题的未来走向?比如,训练数据是否属于「合理使用」?

Sam Altman:这是我目前的猜测。正如社会与技术共同演进一样,随着技术向不同方向发展,情况也会变化。比如我们已经看到,版权方对视频模型的反应,就和当初对图像模型的反应很不一样。所以这个领域会持续演变。但如果让我从今天的立场做一个预测,我认为社会最终会接受:AI 用公开数据进行训练属于「合理使用」(fair use)但在生成内容时,会有一套新的模式,比如你要模仿特定风格或使用某个 IP。

这就像一个作家,可以阅读一部小说并从中获得一些灵感,但不能直接抄袭。你可以讨论哈利·波特,但你不能把整本书背出来当成自己的作品。

另外,我觉得还有一件事正在发生变化,这点在 Sora 上特别明显。我们当然收到了很多版权方的担忧,但同时也收到了很多另一种声音:他们担心的不是我们用了他们的角色,而是我们用得还不够多。他们当然也需要限制,不希望自己的角色说出一些疯狂或者冒犯的话,但他们更希望粉丝能和角色互动,因为这样才能建立情感连接,让他们的 IP 更有价值。如果我们的模型总是选择别人的角色而不是他们的,他们反而会不高兴。

所以,我完全可以想象这样一个世界:在版权持有者自己决策的前提下,他们担心的将不再是「用太多」,而是「用太少」。


06 

AGI 的核心是发现新知识,

AI 科学家是未来方向

主持人:从 ChatGPT 发布到现在,AI 的发展肯定有很多超出你预料的地方。如果让你只挑一件,什么事最让你感到惊讶,甚至彻底改变了你之前的某些判断?

Sam Altman:有很多事让我惊讶,但最有趣的是我们发现了多少「新东西」。

当初我们发现语言模型的 Scaling Laws 时,我们以为自己偶然发现了一个巨大的秘密,这感觉像是一次不可思议的胜利。我当时想,我们可能再也不会有这么好的运气了。但深度学习就像一个不断创造奇迹的源泉,我们接二连三地取得了突破。当我们再次在推理模型上取得突破时,我同样觉得,这样的好运可能不会再有第二次了。这项技术能如此成功,似乎是一件概率极小的事情。但后来我想,也许所有重大的科学发现都是这样:当它足够基础、足够根本时,它的潜力就会持续不断地涌现出来。但进展的速度非常快,如果你现在回头去用 ChatGPT 刚发布时的 GPT-3.5,你会觉得:「我简直不敢相信当时有人会用这个东西。」而现在,我们已经创造出了巨大的「能力富余」(capability overhang)。

普通大众对 AI 的理解还停留在 ChatGPT 的水平;然后硅谷的一些技术爱好者在使用 Codex,他们会觉得普通人根本不懂 AI 已经发展到什么程度了;而极少数顶尖科学家又会觉得,那些用 Codex 的人也同样不了解前沿模型真正的潜力。今天,模型的能力和公众的认知之间已经存在巨大的鸿沟,我们在能力上已经走了非常非常远。

主持人:我们用大语言模型(LLM)到底能走多远?在哪个节点会需要新的技术架构或突破?

Sam Altman:我认为,仅凭现有的技术路线,我们就能走得足够远,远到足以创造出一个能帮我们找到下一条技术路线的 AI我知道这个答案听起来有点像自我循环,但你想想,如果基于 LLM 的系统,它的研究能力能超过整个 OpenAI 团队的总和,那或许就足够我们抵达下一个里程碑了。

主持人:你之前对 AGI 的定义是:当它在大多数具有经济价值的任务上超过人类。如果某个模型在 GDPval 的得分达到某个程度,你会认为 AGI 实现了吗?

注:GDPval 是 OpenAI 于 2025 年 9 月 25 日提出的一项新的评估方法,用于衡量 44 个职业中具有经济价值的现实任务的模型性能。

Sam Altman:我最近也在认真思考这个问题。首先,像很多人一样,我对 AGI 也有多个定义。离目标越近,这个概念反而越模糊。但对我来说,最重要、也是让我最惊喜的一点是:我们已经开始看到 AI 具备「发现新知识」的能力了。也就是说,AI 可以扩展人类目前的知识边界。虽然现在这些例子还很小,但这才是我最在意的突破。

主持人:我们往后看几年,你认为 AI 模型下一个真正让人兴奋的能力跃迁会是什么?是更深度的白领工作替代、AI 科学家,还是人形机器人?

Sam Altman:会有很多方面,但你提到了我最兴奋的一点,「AI 科学家」。我知道关于图灵测试的严格定义一直有争议,但大众理解的那个图灵测试,早就被我们不经意间超越了。

我们之前都觉得图灵测试遥不可及,是 AI 领域的终极考验。然后突然之间,它就被攻克了。全世界为此热议了一两个星期,然后大家很快接受了现实:「好吧,看来电脑现在也能聊天了。」然后一切照旧。我认为,科学领域正在发生同样的事情。

对我个人而言,真正的图灵测试,是看 AI 能否独立进行科学研究。那才是真正能改变世界的时刻。而随着 GPT-5 的出现,我们已经开始看到一些微小的火花了。你会在 Twitter 上看到这样的例子,有人分享它帮助自己有了一项新的数学发现,或者在我的物理、生物研究项目中解决了一些小问题。我们看到的一切都表明,这个方向将会有更大的发展。

所以我认为,在两年内,模型将能承担更大部分的科学工作,并做出重要的发现。这是一件疯狂的事情,将对世界产生巨大的影响。我一直相信,从根源上说,是科学进步在推动人类社会变得更好。如果我们即将迎来更多的科学进步,那将是一件大事。

主持人:这很有趣,因为这是一个人们不常谈论的积极变化。当谈到 AI 变得极度聪明时,评论经常是聊到负面影响。但对于碳排放和疾病这些问题,我们确实需要更多的科学。

Sam Altman:是的,这一点说得很好。我记得 Alan Turing 曾说过,有人问他:「你真的认为计算机会比杰出的人类头脑更聪明吗?」他回答说:「它不必比杰出头脑更聪明,只需要比平庸的头脑更聪明就行,比如像 AT&T 的总裁那样。」

图片
更多阅读

对话 Plaud 莫子皓:你还记得 PMF 的感觉吗?

Nano Banana 核心团队:图像生成质量几乎到顶了,下一步是让模型读懂用户的intention

时隔 7 年,Notion 发布 3.0 版本,全面进入 Agent 时代

扒完全网最强 AI 团队的 Context Engineering 攻略,我们总结出了这 5 大方法

转载原创文章请添加微信:founderparker

内容中包含的图片若涉及版权问题,请及时与我们联系删除