
作者:紫晗
编辑:李宝珠
转载请联系本公众号获得授权,并标明来源
在与 Y Combinator 的访谈中,Anthropic 首席技术官 Tom Brown 回顾了自己从创业到 AI 研究的转型之路。他谈到「需求匹配度」以及「Scaling Laws」带来的影响,解释了离开 OpenAI 创办 Anthropic 的原因,并谈及了 Claude 系列模型在迭代中遭遇的困难与突破,同时透露了 Anthropic 在多芯片战略与安全愿景上的考量。
在全球人工智能的快速演进中,Tom Brown 的名字格外引人注目。作为 OpenAI GPT-3 的核心负责人,他见证并推动了大语言模型从实验室走向产业化的关键一跃。如今,他又以 Anthropic 联合创始人兼首席技术官(CTO)的身份,带领团队推出 Claude 系列模型。从某种角度来看,Tom Brown 的经历,折射出了 AI 发展的关键节点。
与大多数循规蹈矩的工程师相比,Tom Brown 的职业路径更显曲折。他早年投身创业领域,从自学数学与机器学习起步,逐步进入前沿科研圈。凭借在工程与组织上的跨界经验,他加入 OpenAI 负责核心研发工作,并在 GPT-3 项目中发挥了关键作用。从创业到科研的非线性成长,使 Tom Brown 兼具了技术探索与战略判断的独特视角。
近日,在与 Y Combinator 的访谈中, Tom Brown 分享了他从创业者到研究者的转型心路,并谈及 Claude Code 的构建、GPT-3 和 LLM 系统设计的经验教训,同时涉及对算力、能源与未来 AI 安全等挑战的思考。HyperAI超神经在不违原意的前提下,对该访谈的部分精华观点进行了整理,以下为访谈实录。
从 OpenAI 到 Anthropic,Tom Brown 的早期创业历程
Q:你早期在创业中学到了什么?
Tom Brown:我很早就体会到,在创业环境里,你必须「是狼而不是狗」,这意味着不能等任务、听指令去做事情。因为创业的时候,没有人会告诉你具体该干什么,你每天面临的是各种模糊的问题和生死攸关的挑战。那段经历让我养成了主动尝试解决问题的习惯,我认为这种转变是有价值的。
Q:你是如何从创业转型到 AI 的?
Tom Brown:那时我觉得自己在创业过程中积累了一些直觉和执行力,但缺乏硬核的数学和机器学习知识。如果我们要创造出革命性的人工智能,那么这些是必要的。我花了 6 个月时间自学,啃那些我以前完全绕着走的内容。我需要用长时间的自学来确保自己不会成为团队的累赘,而是能真正助益团队的角色。
Q:在 OpenAI 早期,你最深的体会是什么?
Tom Brown:当时的 OpenAI 其实和今天完全不是一个概念。我们在旧金山一个像巧克力工厂一样的办公室里办公,面积小,设施也很临时,但外界已经承诺投入 10 亿美元资金。这种反差感非常强烈:一方面是资源上的巨大期待,另一方面是每天都在解决最基础的问题。我们做过很多尝试,比如搭建 StarCraft 的环境、训练强化学习代理,但真正让人震撼的是语言模型。当 GPT-3 出来的时候,大家都有一种直觉:这东西不仅仅是一个科研 demo,而是某种通用智能的雏形。
Q:为什么要离开 OpenAI 创办 Anthropic?
Tom Brown:OpenAI 是我成长的地方,但后来团队内部有不同的想法。有些人觉得我们需要考虑安全、长期风险的组织。我当时被这种氛围吸引,于是和一小群人出来创办 Anthropic。老实说,那时我们没有完全明确的路线图,很多地方都在摸索。
Q:Claude 的发展过程中遇到过哪些困难?
Tom Brown:说实话,一开始我们并不顺利。Claude 1 的时候,效果没有达到预期,很多时候只是一个「还不错的模型」,而不是突破性的。再加上基础设施建设拖延,我们有点落后于预期。转折点出现在 Claude 3.5 Sonnet,尤其是在代码方面的能力突然变得非常强。这不仅让我们自己看到了希望,也提高了模型的外界评价。
Q:介绍一下 Claude Code 和 Agent 工具的推出?
Tom Brown:这个其实挺有意思的。我们最初做 Claude Code 完全是为了内部使用,当时我们绝对不知道它会在市场上取得成功,在那之前,我们完全把赌注押在了 API 上。结果市场反响比我们预想的还要好。尤其是开发者群体立刻抓住了它的价值,成为了打开市场的关键。
「需求匹配度」与 「Scaling Laws」,Tom Brown 的两次直观震撼
Q:从 Grouper 到 Tinder,你看到了什么差别?
Tom Brown:Grouper 本质上是把三对男女凑在一起去酒吧见面,这个想法有趣,但增长受限。Tinder 在我们做 Grouper 的时候上线了,它用「双方都点喜欢才配对」的机制解决了线上约会里的一些核心问题,比如降低了被拒绝的痛苦,也让女生的体验更安全。这更契合用户的需求,因此 Tinder 的方案成功了。
Grouper 和 Tinder 两款约会应用程序。此处 Tom Brown 提及自己与 Grouper 创始人 Michael Waxman 相识的经历,并随后谈及 Tinder 在社交问题上相比 Grouper 提出了更优越的解决方案。
Q:Scaling Laws 给了你什么启发?
Tom Brown:我觉得 Scaling Laws 是我们领域里最「笨拙但有效」的发现。原来的缩放定律就像一条直线,大约是12个数量级,这是一个非常大的数字,我从来没有见过超过12个数量级的情况。因此我确信,我要把所有的工作都集中到扩大规模上,很多人当时很不满,说这就是在往 GPU 上浪费钱,但 Scaling Laws 的结果是稳定的。我觉得我们应该敢于做「傻但有用」的事情。
AI 的当下战略与未来挑战
Q:Anthropic 在算力和基础设施上面临哪些挑战?
Tom Brown:现在的挑战和几年前完全不一样。以前我们担心的是有没有好的模型思路,现在真正的瓶颈是算力和能源。AGI 级别的训练需要的 GPU 数量和电力正在以每年 3 倍的速度增加,这在科技史上几乎找不到类比。你必须建造巨大的集群,优化能源使用。
Q:Anthropic 在芯片和战略上如何布局?
Tom Brown:我们不想把命运完全押在一家供应商身上,我们同时也在尝试 Google TPU 和亚马逊的 Tranium。这对工程团队来说意味着更多的复杂性——我们需要将性能工程团队分散到所有这些平台上。但长期看,这提高了我们的灵活性:一方面是吸收额外的产能,因为总共有更多的产能;其次是我们可以为合适的工作使用合适的芯片。
参考链接:
1.https://www.youtube.com/watch?v=JdT78t1Offo&list=PLynUse_piAuGeHpk87iKkQKvZHlcMbNrE&index=6


戳“阅读原文”,免费获取海量数据集资源!
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢