Gemini 模型今年很强,谷歌旗下的 AI 应用也开始支棱起来了。

一直备受好评的 NotebookLM,今年接连发布新功能,目前移动端月活用户达到 800 万。

Gemini App 月活从 8 月的 2.66 亿增长到了 11 月的 3.46 亿,净增 8000 万用户。在四个月内,Gemini 市场份额上升 3 个百分点,反观 ChatGPT 市场份额下降了 3 个百分点。

过去一年内,付费用户的增长更为突出,Gemini Pro 订阅量同比增幅接近 300%,大幅领先于 ChatGPT 的 155% 增速。

这股势头背后,离不开一个关键人物:Josh Woodward,Google Labs 副总裁兼 Gemini 应用负责人。

今年 4 月,Woodward 全面接手了谷歌 AI 战略核心 Gemini 应用的工作。对比其他大厂高管, Woodward 身上,有一股独特的「创业者」气质:

  • 快速行动,看重从一个点子到最终交到用户手里的速度。NotebookLM 以 5、6 人的小团队形式,用六周时间快速完成了原型开发;

  • 懂技术,且有远见地能思考技术未来的演变方向和合适的应用方式。在 Gemini 3.0 的发布中,Woodward 提出了非常前瞻的概念:生成式界面。

  • 聚焦真实用户的反馈。非常痴迷解决用户在使用产品时遇到的微小痛点,常在 X、Reddit 等社交平台上和用户交流;

  • 有能力绕开谷歌庞大的官僚体系。建立了「block」内部系统,帮助团队推进项目,打破内部障碍,争取资源;

谷歌实验室前联合负责人 Clay Bavor 这样评价 Woodward:行动迅速、善于打破障碍、执行力强,这些能力让他稳稳地立在了谷歌最重要工作的中心。

⬆️关注 Founder Park,最及时最干货的创业分享


超 17000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
图片
进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

Google ToC AI 应用的真正一把手 

Josh Woodward,42 岁,现任 Google Labs 副总裁兼 Gemini 应用负责人。

作为谷歌从「搜索优先」向「AI 优先」转型的核心人物,今年 4 月,Woodward 全面接手了谷歌 AI 战略核心 Gemini 应用的工作。在此期间,推出了在社交平台爆火出圈的 Nano Banana、性能强大的 Gemini 3.0 系列模型、以及生成式界面等一系列创新功能。

在他的领导下,Gemini 应用的月用户数从 3.5 亿激增到了 6.5 亿。

Google I/O 2025 现场,Woodward 展示 Gemini 的新进展和 AI Labs 的新产品

在接管 Gemini 之前,Woodward 负责带领 Google Labs,探索各种实验性 AI 项目。其中,团队推出的笔记产品 NotebookLM,大受好评。Woodward 开启了「内部创业」模式,组建了 5-7 人小组,仅用六周时间就完成了首个原型开发。

CNBC 评论,「Woodward 的优势之一是消除障碍,使团队能够快速开发产品。」

快速行动、突破常规的行事风格贯穿了 Woodward 在谷歌的 16 年职业生涯。2009 年,Woodward 以产品管理实习生的身份加入谷歌,随后担任了多个产品管理职位,也是谷歌开拓新兴市场「下一个十亿用户」(NBU)项目的首批核心成员。

除了强大的执行力外,Woodward 身上还有一种独特的「创业者」气质:好奇心和影响力。在 NBU 期间,Woodward 每周都会撰写一份内部通讯,分享近期思考和感兴趣的东西。Woodward 的阅读量极大,甚至成为了谷歌高管们寻求书籍推荐的首选对象。

在过去一年中,Woodward 是如何做到带领 Gemini 甚至整个谷歌走出低谷的?我们梳理了他在关键产品上的核心策略、技术思考与管理理念,或许能找到答案。


02 

突破「大公司病」,

快速开发新产品

2022 年,Woodward 加入 Google Labs 后,迅速成为了多款高影响力产品开发的核心。

NotebookLM 就是 Google Labs 团队早期开发出的一款 AI 产品。最初源自于团队内产品经理 Raiza Martin 的个人项目 Project Tailwind,一个笔记工具创意。

Woodward 以内部 5 到 7 人小组的形式,基于这个创意源点,进行快速迭代开发,六周时间就完成了产品首个原型开发。从一个简单的笔记工具,打造成了一款能深度分析用户上传的文档、PDF、音视频,并提供摘要和洞见的 AI 产品。

NotebookLM 在 2023 年 7 月发布后,一炮而红,迅速获得了极高的人气。在为了收集用户反馈而建立的 Discord 服务器中,有 20 多万成员。

AI 不是目的,是一种全新的「内容容器」

Woodward 对于 AI 工具价值的理解,非常深刻。他认为,AI 不仅仅是一个从海量互联网信息中提取答案的搜索引擎,而是更应该成为一个帮助用户去深度理解、重构自有知识的伙伴。所以,NotebookLM 的一切分析、摘要和回答,都是严格基于用户上传的原始资料,规避了常见的「幻觉」问题。

Woodward 将 NotebookLM 形容为「一种新的内容容器或格式」。这个「容器」被直观地呈现在了产品界面上:左边是用户上传的原始资料,中间是与 AI 的问答互动,右边则是能生成思维导图、摘要等丰富的媒体输出。所有内容都有源可溯,保证了思考的严谨性。

Josh Woodward 在 Google I/O 2024 上演示音频概览功能

这个核心理念,同样在「视频概览」和「音频概览」功能上也体现得非常明显。例如,「音频概览」功能,用户可以上传多个信源,让 AI 来生成一期播客;「视频概览」功能,用户可以上传数十个、甚至上百个不同格式的资料,最后自动生成一个图文并茂、带有语音讲解的视频幻灯片。

NotebookLM 将海量、零散的信息,提炼成了一个几分钟就能消化吸收的精华版本。

这也侧面反映了 Woodward 对于 NotebookLM 核心价值的判断:在「整理-输出」环节,AI 拥有非常丰富的探索空间,能够帮助用户用全新的方式来转换、重构信息。

这种转换,本质上降低了高质量内容创作的门槛。整理信息同样也是一种创造。

Woodward 在播客中提到,团队的最终目标是,「既能帮助顶尖人才更快、更有创意地完成工作,又能让那些原本不具备能力的人也能做到。」

「放手让他们去做」的大胆行事风格

Woodward 的行事风格快速、大胆,也是让 NotebookLM 这个「新品类」产品成功的重要原因。

Woodward 敢于突破大厂中的官僚主义。为了更好地收集用户反馈,NotebookLM 使用了更贴近普通用户的外部平台 Discord,这对于像谷歌这种更倾向使用自家产品的大公司,是非常不容易的。

据当时的项目负责人 Martin 回忆,行政部门不断追问:「为什么不用 Google Meet?为什么不用 Google Groups?」是 Woodward 亲自出面协调,确保了团队可以继续使用 Discord。产品首批上线的新功能都是源自于 Discord 中与使用者的反馈、交流。目前,该频道已经有 23 万名成员。

另一个非常大胆的举动是,Woodward 邀请了与谷歌毫无交集的外部科技作家 Steven Johnson 加入团队,来共同打磨 NotebookLM。Woodward 本人是 Johnson 的忠实读者,他认为,通过这位科技史作家的视角,可以为产品带来不同的价值。

Johnson 带来了不同的视角:最好的思想往往诞生于不同信息的碰撞。NotebookLM 被设计成能够「发现连接」的工具,能指出用户上传的生物学论文和建筑学笔记之间的潜在联系。这种设计超越了单纯的「搜索检索」,进入了「辅助思考」的领域。

Johnson 在后来的采访中提到这次合作,称赞 Woodward 的管理方式,「能够放手让他们去做」。

也正是 Woodward 这种「大胆」的行事风格的推动,让谷歌重新具备了推出 NotebookLM 这种新品类产品的能力。


03

8 个月时间,

带领 Gemini App 走出低谷

AI Agent 公司 Sierra 联创 Bavor 对 Woodward 的评价是:他是公司里最早看到 LLM 在产品构建方面潜力的人之一,且完全理解一项新技术,能够有远见的预见到技术未来的演变方向和应用方式。

这一点,在 Woodward 接管 Gemini 应用后的一系列动作上,体现得非常明显。

图像生成功能 Nano Banana

Nano Banana 功能的火爆出圈,是 Woodward 团队对消费级市场的敏锐发现。

今年 8 月,Woodward 团队在 Gemini 应用中推出了图像生成器 Nano Banana。该模型在技术上解决了当时 AI 生图的两个核心痛点:能在图片中相对准确地渲染文字,且在生成系列图片时保持了出色的角色一致性。

生成「迷你手办」的各类玩法迅速通过社交媒体传播,形成了病毒式增长。

Woodward 团队的应对方式,也从侧面展现他们的产品策略:快速观察、简化并放大用户的自发创造力。

Woodward 提到,「现在我们把这个流程做得非常简单。你只需打开 Gemini 主页,点击这个功能,上传一张图片,就能生成一个七分之一比例的手办模型,提示词我们都已经预设好了。」观察用户行为,然后把它变成一个默认提示词放在首页。同时,团队还迅速将一些用户高频生成场景,固化成一键可用的功能,极大地降低了普通用户的参与门槛。

这种策略的效果非常惊人。到 9 月底,Gemini 生成的图像数量突破了 50 亿张,应用在苹果应用商店的榜单上超越了 OpenAI 的 ChatGPT。Gemini 应用的月活跃用户数从 3 月的 3.5 亿猛增至 10 月的 6.5 亿。

自今年 4 月以来,Gemini APP 的更新

(图源自 Woodward 的 X 帖子,Nano Banana 制作)

AI 的未来交互将远超当下的聊天框

Woodward 认为,第一代 Nano Banana 模型在对话式编辑方面是一个巨大的飞跃。「对话式编辑」意味着用户不仅能通过文本生成图像,还能通过后续的自然语言指令,对图像进行不断的修改和迭代,比传统的「一句话,一张图」模式要深入得多。

Nano Banana 功能的实现源自于 Gemini 模型的核心架构。Woodward 强调,「Gemini 模型从一开始就是多模态的,这和市场上其他一些模型非常不同。」原生的多模态能力,意味着模型不是简单地将文本、图像、音频等不同模块拼接在一起,而是在底层就具备了对不同信息形态的统一理解和处理能力。这也是像 Nano Banana 这样看似简单的功能,能够实现复杂、流畅的跨模态创作的根本原因。

进一步,Woodward 认为,未来 AI 的交互将远超当下的聊天框形式。AI 终极形态应该是能够根据用户需求,即时生成可交互的界面、组件甚至微型网页。

在 Gemini 3.0 的发布中,Woodward 提出了一个非常前瞻的概念:生成式界面(Dynamic View)。AI 不再只是生成内容,它开始实时动态生成一个为用户搜索量身定制的可视化界面。例如,教师可以利用 Gemini 3.0 实时生成互动的学习小部件或网页,来支持个性化和适应性学习。这一功能目前已经在 Gemini App 中测试。

目前还在测试中,未全面开放。

Woodward 认为,这类生成界面是新颖且令人兴奋的开始,AI 的交互将不再局限于传统的一问一答模式。语音、图像和视频等更动态、更丰富的多模态交互方式,将逐渐成为主流。

每当有重大技术变革时,通常都会伴随着输入输出方式的转变。我们现在才刚刚开始,还有大量的创新空间。我们正在打破那些非常刻板的输入输出模式,转向一种可能更动态、流畅的交互方式。」

通过上下文工程,打造一个主动式的私人助手

Woodward 对 Gemini 应用最终的定位是:个人化生活助手。Woodward 提到,AI 助手核心要素是「三个 P」:个人化(Personal)、前瞻性(Proactive)、功能强大(Powerful),其中「个人化」应该放在首位。

现在 Gemini 团队收到的最多的用户请求之一就是:我想把我的 Gmail、谷歌相册或者其他谷歌服务都接入到 Gemini 中。

Woodward 认为,要实现真正的个性化,AI 必须能够理解用户的个人上下文。在用户的许可下,AI 能够深入理解个体的需求和生活轨迹。这背后的「上下文工程」非常重要。

「AI 的核心工作之一,就是让用户能够轻松地将模型引导至他们希望处理的特定信息池。而 Gemini 模型从诞生之初就具备的原生多模态能力,正是实现这一点的基础。能够无缝地整合文本、图像、音频、视频等多种信息源,为 AI 提供一个丰富且立体的用户上下文。」

Woodward 认为,未来的 Gemini 更像是一个真正的私人助手。用户可以向它询问具体的问题,比如「从收件箱深处找回某条信息」,更可以探索那些宏大而开放的命题,例如「我应该如何规划我们家未来几年的生活?」或者「我怎样才能成为一个更好的父亲?」. 通过深度理解用户的个人数据和生活情境,Gemini 可以提供真正个性化的建议和支持。


04

「Block」系统绕过官僚,

组建全能型小团队

在以数据和流程著称的谷歌内部,Woodward 的领导风格非常鲜明:能够快速行动、聚焦真实用户的反馈,以及有解决小而关键问题的能力。

建立「block」内部系统,打破内部障碍、绕过官僚系统

Woodward 最广为人知的特质之一,就是他有能力绕开谷歌庞大的官僚体系。Woodward 帮助建立了一个名为「block」的内部系统。任何员工一旦在项目中发现或者遇到潜在障碍,无论是资源、流程还是跨部门协作问题,都可以提交一条记录。Labs 内部会有一个专门的团队负责解决。

这个机制确保了小团队的创新动力不会被大公司的惯性所消耗。比如,NotebookLM 早期版本发布后,产品急需更多的 TPU 资源,就是通过这套内部协调机制,Woodward 成功地为团队争取到了关键的计算资源。

「Papercuts」机制:从细微处赢得用户

Woodward 非常痴迷解决用户在使用产品时遇到的微小痛点,来快速迭代产品。为此,他创立了一个名为「Papercuts」的流程,专门用于快速响应和解决影响用户体验的细枝末节问题。

同时,Woodward 会 X、Reddit 等社交平台上向用户同步这些改进。10 月,Woodward 在 X 上发帖称:「小改进已完成:现在你可以在 GeminiApp 的对话中途更换模型,无需重新开始。」

Woodward 在 X 上活跃得像个「假号」,经常收集用户反馈

NotebookLM 的前设计师 Jason Spielman 评价,「Woodward 这种对最终用户的投入程度,我在其他领导者身上从未见过。」

早期产品的成功,数据不是唯一标准

Woodward 认为,一个早期产品的成功与否,不能只看数据,更应该走出去,和真实的用户交流。

「对于我们的很多产品,当我们第一次获得一万个周活或者日活用户时,都会特别兴奋。在谷歌很多团队,他们的统计后台可能都看不到这么低的数字。这些里程碑对我们非常重要,因为它初步验证了产品的用户留存能力。但在产品开发的早期,数据后台可能非常具有欺骗性。

所以,我总是告诉团队:你要看数据,培养数据直觉,但你更要走出去,和真实的用户待在一起。」

「因为当你做出一个真正了不起的东西时,你从他们使用时的眼神里就能看出来。他们可能会微笑,或者会以一种有趣、惊喜的方式感到惊讶。这些都是我在项目早期阶段总会寻找的更偏向定性的东西。」在 Woodward 看来,在创新的初期,产品开发更多是艺术而不是科学。

在谷歌内部建立起快速发布产品的文化

如何在谷歌内部建立快速产品发布文化,Woodward 分享了三个核心要点。

一是保持极小的团队规模。Google Labs 的新项目通常是由一个 5-7 人的核心团队启动。Woodward 分享,「我早期产品生涯中犯的一个错误是,过早地组建了太大的团队,这会制造出很多工作,但你连产品是什么都还不确定。」

团队只有在明确捕捉到市场拉力后,才会相应地扩大规模。例如,NotebookLM 团队早期只有几名成员,在获得初步的市场反馈后,才逐步扩大团队变成了十人,再到二十人,再到五十人,最后到八十人。

Woodward 在一次采访中提到,「每一个伟大的产品,最初都只是来自少数几个心怀梦想的人。但在谷歌这样一家已经拥有了一系列成功产品和业务的大公司里,想要从零开始做些小事,反而会很困难。这也是我们重启 Labs 的原因之一:我们希望有一个地方,能够专门去发现和打造那些具有高潜力的小项目,并悉心培育它们。」

二是将「推向用户」作为最高优先级。整个流程的优化目标,就是尽快把产品交到真实用户手中,获取反馈。「我们非常看重从一个点子到最终交到用户手里的速度。整个流程的优化目标,就是尽快把产品交到用户手里。因为只有当产品到了用户手里,你才真正意识到自己离目标还有多远。」

以 Flow 为例。Flow 是一个基于 Veo 3 模型的视频创作工具,首次给 AI 视频带来了音效。Flow 项目从想法诞生,到最终在 I/O 大会上正式发布,交到用户手中,总共只花了 86 天。

Woodward 认为,技术本身很重要,但如何把它包装好,让人们能最大限度地利用它,也同样重要。

「在产品开发的早期阶段,最大的风险就是你做的东西没人需要。发现这个问题的时间拖得越久,代价就越大。

所以,我们的首要任务,就是在项目最初的 50 到 100 天内走出办公室,直接面向用户,和他们一起进行产品共创。

这种做法总能带来反馈,我们也常常在早期就发现,自己最看好的想法其实并不对。产品原型会被误解,核心功能会反响平平,一些基本假设也会被证明是错误的。

但这没关系。这是创新过程中必须付出的代价,走向成功的最好方法,就是尽可能快地迭代和学习。」

三是在招聘团队成员时更倾向热爱动手的「创造者」。在面试时,会看候选人在业余时间会做些什么东西?「喜欢动手、喜欢创造的人,会通过原型来表达自己,而不是通过文档。这是一个非常重要的因素。」同时,更倾向于学习速度更快的候选人,且有『我能行』的积极心态。」

更多阅读

LangChain Agent 年度报告:输出质量仍是 Agent 最大障碍,客服、研究是最快落地场景

Karpathy 2025 年度盘点:o3 是真正拐点,Cursor 证明了应用层比我们想象的要厚

一场社会实验:我们让 Claude 管理办公室零食机,它亏了几百美元

12月,我们推荐这 7 款 AI 新品

转载原创文章请添加微信:founderparker

内容中包含的图片若涉及版权问题,请及时与我们联系删除