5 月 13 日,在零一万物发布会上,李开复发布了新的模型、应用和开放平台,详细介绍参见官方文章。
千亿参数闭源大模型 Yi-Large,零一万物首次发布的闭源产品。 零一万物已启动下一代 Yi-XLarge MoE 模型训练。 API 开放平台上线:面向国内市场一次性发布了包含多款 Yi 系列模型 API 接口。 开放平台官网:https://platform.lingyiwanwu.com ToC 产品「万知」上线,一站式 AI 工作平台。 网页端(https://www.wanzhi.com/)和微信小程序「万知 AI」登录体验。
零一万物从 2023 年起就进行了多个产品的尝试,其中一款主打海外市场生产力场景的产品,预计今年营收 1 亿人民币,用户已达到 1000 万。
发布会上,李开复提出了 TC-PMF 的方法论。相对移动互联网时期的黄金标准 PMF,李开复认为现阶段 AI 产品的创业还需要考虑 Technology(技术)和 Cost(成本)。
此外,李开复与零一万物的三位相关负责人,分享了他们在模型、产品和 API 层面的进展,以及创业一年背后他们对各自业务和组织的思考。我们整理如下,部分内容来源于《晚点 LatePost》对李开复的专访报道。
蓝雨川:零一万物 API 平台负责人
01
零一万物是怎么做产品的?
Q:如何做基于大模型的生产力产品?
曹大鹏:我分享几个点。
我们的差异化是第一天就面向生产力真正的痛点,在白领和知识工作者平时在工作当中遇到的真实的最痛点里找读、写的核心场景,并不只是给 chatbot 加上 AI 的能力,因为后者没有办法解决用户真正工作中的问题,所以它的留存和增长也不会好。
基于这个理念我们打造了 AI-First 的 Office 的产品形态。为什么我们觉得它有机会呢?
首先我们有一个理念,大模型会把所有之前的积累很多年的生产力(产品)的工作流重构一遍。
Office 已经推出四十年了,之前所有的用户在工作当中要去写一个文档,方式都是打开一个空白页面去想到底应该写什么,这个过程对每一个工作的白领来说最困难。但大模型带来的交互变革,就是人机对话式的自然语言方式,可以输入一个问题或一个需求就可以开启你的工作。
我们在万知里,包括我们海外的生产力产品,所有工作流开始都是从一个对话开始。我们做一个 PPT 只需要输入一个标题就可以了,不像原来先是找到一个模板,这是一个巨大的变化。
从这个角度,我们找到最痛点的白领的工作场景,同时用 AI-First 的交互方式把它做到成功,得到的结果:
我们海外的产品去年 9 月推出时也有 Chat with Doc 的功能,我们会发现用户的需求和使用非常井喷式,很快达到了 PMF 的状态。我们通过产品迭代和用户增长的优化,很快把我们的 ROI 打到 1 以上,因为海外是付费订阅制,很快在收入上也会获得非常好的成绩。我们今年按现在来看预期差不多会是一亿人民币的收入规模,我们 ROI 还是在 1 左右。这样的结果至少从国内大模型公司来看是非常有优势的。
Q:国内产品「万知」做了哪些优化?
曹大鹏:我们做万知的过程,并不是把(Yi 系列)模型直接匹配到产品里,因为在国内市场要做大量的优化。我们向量数据库成本的降低,联网能力的提升,我们国内 PPT 配图的角度会有单独图片的来源,这些能力本身都是需要重新基于国内的使用场景做,基于我们的模型做优化。
还有移动端,中国移动端和 Web 端的流量是绝对引领的状态,所以我们小程序和 Web 端可以实现多端协同的工作场景。举个简单的例子,本身你现在不在电脑旁边,需要马上做一个演示,可能只需要在万知微信小程序上输入需要演示的主题,从电梯上来到你的工位两分钟,打开电脑 PPT 在万知网页版已经做好了,你只需要做简单的文字和配图的修改就可以了。
现在大模型应用本身今年肯定在国内是应用落地的一年,这一块国内国外都遇到很大的挑战。最开始我们先推出海外产品,ROI 非常健康,我们收入获得非常高速的增长,国内万知基于本地特有场景做专属优化,随着我们模型能力一直往前突破,在产品上找到真正高价值,未来甚至有付费能力意愿的场景做匹配。
Q:现阶段产品最重视的市场反馈和数据指标有哪些?
曹大鹏:对于一个 PMF 阶段的产品,从 0 到 1 我们会关注产品长期留存,以及能不能产生用户自传播的口碑。从 1 到 100,我们更关注增长速度会不会足够快,ROI 是不是健康,以及商业模式、收入付费转换等指标。
我们现在打造 AI-First 的时候,主要思路是 TC-PMF。这里有两个东西,第一个是技术,第二个是成本。
技术方面,最核心的是模型能力各种指标。现在被大家比较公认的指标,首先是模型 benchmark,这一点我们的指标达到全球业界领先水平。但是做应用的时候光有这一点远远不够,还要求我们有从用户视角,模型的结果能够满足用户需求的指标。
成本方面,大家会发现抖音真正变成一个 Superapp 的时间点,第一个是 4G 普及,第二个是安卓千元机的普及,一下子把短视频的市场扩大 100 倍。任何新技术浪潮来了之后,最开始还不够完善,当它到达一个临界点——我们认为核心是看普惠点。模型成本不会成为做一个海量体量产品的障碍,这样的 popular app 才有可能发生。但我们不会等到那个时间点来了之后再做应用,这个过程中模型和成本都是在动态变化,应用场景随着模型能力提升不停解锁,我们要一直非常务实的迭代,从用户角度出发,找到 TC-PMF 产品模型。
Q:从零一已有的产品尝试中看到了什么?
李开复:我们最早上线的生产力产品的 ROI 已经可以做到 1 了,也就是我们从用户手中收到的订阅费,已经低于我们获取用户的成本加 GPU 的成本。今年应该会有一个亿的收入,有近千万用户。
但这还不是达到了 TC-PMF 的普惠点,因为规模还不够大。普惠点是真的有上亿用户,每天或者每周去使用,而且账要能算清楚。
我们探索的一些其它应用,娱乐、陪伴类的都有,但 ROI 都没做到过 1,30 日留存也不够好,我们就没有去推。
Q:为什么只有生产力产品的 ROI 能达到 1?
李开复:生产力应用的付费点最明确,虽然技术上有幻觉问题,但最终是人来把关内容,因此也 OK。
而其他领域,包括那么多人学的 Character.ai,都有 TC-PMF 的问题,主要是降低推理成本和提高体验上的冲突现在还比较难解决。
你要降低推理成本,只有缩小模型,这就导致体验不够好,用户不会来。你用了大模型,体验好了,但推理又贵了。所以 Character.ai 就没有特别好的体验,因为它用不起 GPT-4,它自己做的小模型又不够好,进入了两难。
一个诱惑是,我们也可以花钱烧出用户,号称做到了几千万用户、几百万 DAU。但是留存不好、ROI 不好,这么做下去最终还是得破产。
我们会把(ROI)0.6 当作一个基准线,烧 1 块钱可以回 6 毛钱时,就可以往前推进。
你一旦推到了 1,就表示增长还可以更激进,我们还没有到一定要追求回本的阶段,我们就会多做一些推广;太低了我们就扎实地提升产品。所以 ROI 会自然地游走在 0.85 到 1.05 之间。
Q:如何理解 ToC 办公领域的产品机会?
曹大鹏:办公领域是一个大的市场,或者说一个赛道。有一次 Google 前 CEO 艾瑞克·史密斯看到我们的产品能生成 PPT,他评价说「信息包装是 500 亿美金的市场」。从市场角度来说,PPT 只是这里面特别小的分类,但信息包装是非常重要的。我们任何工作里面的文档都来自于信息获取与整理,这个部分其实是巨大的市场。
信息包装本身就有 500 亿美金的市场,而整个生产力赛道比这个更大一个量级。包含办公场景的生产力赛道更多是一个需求市场,怎么在这个领域做应用,是做一个 AI-First,还是 AI Enhance?
AI-First 的好处在于,第一,极大降低了用户使用办公软件的产品门槛,原来这些软件之所以用户用,并不是因为它好用,而是因为没有新的技术带来颠覆它的可能性。AI 大模型这个能力是巨大的变量,如果它能把最开始的交互从空白页,让你自己想怎么下笔,变成我只需要输入思路标题,就给到非常多的灵感,然后再把中间的编辑过程提效,原来几个小时做一个 PPT,现在花十几二十分钟,这就是一个十倍体验的提升,因为降低了用户的成本,用户就更多使用 AI-First。
我们海外产品是面向全球的,过程中会发现一些东南亚地区,包括一些欠发达国家地区的用户热情是非常高的。
竞争层面,从市场角度来看,整个生产力赛道收入规模非常巨大,欧美尤其是美国 SaaS 生态非常百花齐放,看上去一个很简单的功能,比如订日历,一年获得几十亿美金收入,有点像消费品的生态,比如国内同样的苏打水有一百个品牌,但是每个品牌都能活得不错,并不存在有人做了,你就没法做的问题。第二点,从竞争角度来说,我们非常坚信 AI-First 产品定义,包括开发的理念,如果 AI-First 极简的交互方式,比传统的一百个按钮软件编辑方式有十倍的提升,用户迁移过来也只是时间问题。
02
模型公司做产品的优势
Q:产品团队和算法团队应该怎么打配合?
黄文灏:我们要打破壁垒,算法团队和应用团队不应该是两个团队,而是一体化 one team。
一方面以应用为目标的产品经理,大家要不断的去了解基础,哪些是模型能做的,哪些是模型不能做的,一定要了解产品的边界在哪里。
另一方面做技术的也是要去了解产品的需求到底是什么,找到一个实际的应用和模型能够快速一体化迭代的方案。基础模型的泛化能力很强,但是专门为一个应用做一个优化,反而也是一个相对来说比较困难的问题。所以我觉得做技术和产品经理之间不应该有太多间隙,大家其实都是一类人。之前在互联网时代成功的产品经理,他们如果复制这个路径去做,会很难在大模型时代成功。包括曹大鹏、蓝雨川花很多时间研究模型的原理,知道模型的边界,这件事情也是很重要的。反过来说,互联网时代最成功产品经理都是技术背景,所以技术在这里面非常重要。
Q:模型团队如何配合产品?
黄文灏:因为我主要负责预训练团队,预训练是以模型通用为目标,我们没有太多考虑应用需求。零一万物有比较多的应用在做,包括像生产力、社交、娱乐,我们希望所有的应用都基于一个通用的模型,来自每个应用的需求也是不一样,所以我们希望预训练模型作为一个基础可以服务所有的应用,这里面最重要的还是模型 general 能力的提升。
我们也发现,看起来社交和娱乐没有太大关系的复杂推理能力,在模型通用复杂推理能力提升以后,用户的沉浸感也会变得更好,留存各方面指标都有提升。
所以预训练模型的能力会给应用提供一个很好的起点。接下来在 continue training 和 SFT 部分可以为应用做很多定向优化,这也不是简单的拿一些和应用场景相关数据过来就能做好。因为我们现在是预训练、SFT 是一个团队,可以知道模型之前预训练的配比,数据质量的控制,用了哪些数据,没有用哪些数据,这是非常重要的信息,大家再往下为实际应用做优化的时候,这些信息的透明度非常重要。这里面的数据质量和数据配比工作一点不比预训练少。
另一方面,为了未来做得更好,在预训练阶段应该有所保留,我们在算法上做一些控制,让未来那些应用做得更好。如果我们只想追求一些预训练的目标,我们可以做到一个模型的的指标比今天发布的更好,但是会透支未来的潜力,这对应用不利,所以我们还是在考虑应用的情况下做一些预训练的工作。
Q:「模应一体」这件事情最大的挑战是什么?如何解决?
黄文灏:最大的挑战还是在组织和人才方面。
我过去一段时间和 OpenAI、Anthropic、xAI 很多同行交流,我们会发现在海外模型应用割裂感更强。一方面优秀的 researcher 们以 AGI 为目标,大家的看法是说现阶段这些应用没什么价值,等 AGI 实现以后,整个商业形态会有很大的变化,所以大家应该更专注于模型能力。现在为了部署一些应用,会消耗大量的算力,其实是阻碍了大家追逐 AGI 的进程。
另一方面做应用的人,他们会觉得模型能力的提升给用户带来的体感不是那么明显。我们花了很多钱,去追求模型性能上或者指标上的提升,但是并没有解决很多用户的问题,所以这个割裂感很强。
硅谷更偏向于追逐梦想,国内更脚踏实地,所以我们一开始会追求模型和应用一体做建设。这两边的割裂是所有大模型公司都要碰到的问题,这里面最难的还是在组织层面和人才层面怎么能把这个事情打通。
Q:零一万物的开放平台发展方向和目标是什么?
蓝雨川:我们到底是专注于 AI 1.0 时代做项目模式交付模式,还是真正能够服务好一些 AI 应用的商业化?
AI 1.0 时代有大量公司做项目交付,但是赚到一次性的钱之后没有后续。我们今天的思路更像云平台,提供一个非常强大的 API 技术能力;我们会提供一系列工具,帮助大家轻便上线;我们提供行业解决方案针对各行各业应用场景做优化。这是我们 API 平台发展的方向和目标。
Q:海外、国内,2B、2C——这些你们都要做吗?
李开复:我们会做很多事,整个公司的设计就是要做一个 AGI 时代的微软。
万知 AI 上线以前,我们在海外市场就已经有 4 个应用了。但有些事我们暂时不会做,比如在国内做 2B,我们不会碰项目制的订单,我认为它还没有逃离上次 AI 1.0 的魔咒。
2B 我们会走 API 路径,不管国内国外,花钱买 API 都是一个已经被教育过的市场。所有的创业基本都应该避免去教育市场,因为这是大厂才能付得起的事情,创业公司没有这样的成本。
03
国内外 AI 产品生态
Q:如何看待国内外应用生态的差异?
蓝雨川:海外 GPT-4 的 API 在去年发布,使海外 AI 生态非常繁荣,很多 AI 原生应用已经诞生,达到了数千万美金的收入,也有非常多的成熟产品和公司用 OpenAI API 做出自己的第二曲线新业务。国内的情况会慢一点,有许多企业在探索,但阶段没这么快。
国内外 AI 生态差异的背后,有两个非常重要的因素。
第一个因素,TC-PMF,我们是不是有一个最优秀的大模型让企业跑通自己的 AI 业务,跑通 AI 新产品的 PMF,能够赚到钱,这是非常重要的。
第二点,我们有足够强大的推理优化能力,把模型 API 成本降得足够低,这样企业的 AI 产品才能赚到钱,持续扩大规模。
Q:怎么做海外营收和增长?
曹大鹏:第一点,我们海外产品第一阶段的商业模式采用会员订阅制,这从 C 端来看算是最健康的商业模式之一。和国内一些视频网站类似,用户如果点击订阅,下个月不退订的话会自动续订。用户不用很多,但是付费订阅费能够支撑增长,包括成本。
第二点,我们的海外产品去年九月份推出,从有部分用户进来,到现在 10 倍、20 倍收入的增长,为什么我们 ROI 能够越来越好?一方面是 AI 渗透的快速增长。新的模型或者产品发布之后,从 earlier adopt 变成往大众推广,尤其是海外欧美国家走得更靠前一点。另一方面是我们的产品力,包括增长获客效率也在持续优化。
Q:先发的海外产品如何「反哺」后发的国内产品?
曹大鹏:我们现在海外产品模型选型是 Yi-Large 加 GPT-4 的组合,我们最开始推出的时候自研模型还没有做好,现在 Yi-Large 已经推出并在海外产品上线,并成为我们实时对比测试自研模型的平台。
我们的海外产品是在去年 9 月份上线,第一版只有 Chatbot、Chat with Doc 两个基础功能。当时推这个功能的原因在于,首先 ChatGPT 是一个爆款产品,它两个月做到一亿用户量,是一个超级的 PMF 产品。但我在用 ChatGPT 产品的时候,发现它的短板在于 Chatbot 只解决基础的问答、文案,包括很简单的任务,但如果定位是生产力方向,我的日常使用场景大量集中在文档角度:找、读、写。ChatGPT 很厉害,我就打它的弱点,所以我们要把 Chat with Doc 这个功能跟 Chatbot 结合做一个完整产品。
一个新技术刚来的时候,一个产品就是一个功能,但是往后都会被更强大的产品替代掉。ChatPDF 很早就推出一个海外产品,但用户不太可能在 ChatGPT 和 ChatPDF 这两个产品里面切换。经过大半年,我们的文档阅读功能,无论在文件处理大小,字数,还是表格处理能力上,在全球同类产品里达到了全球领先。
第二,我们用 GPT-4 API 时发现,它在一些特有场景里面体验非常糟糕,比如说做 PPT,但我们只能用它的 API,只能用 prompt engineering 的方式去解决,因此瓶颈是显而易见的。
但我们的自研模型 Yi-Large 会在这些领域显著超过 GPT 4,这也是为什么我一直坚信只有模型应用上、能力上,组合上结合起来,才能最终做出 AI-First 产品。

更多阅读
AI 应用如何赚钱?全球 AI-Native 公司定价策略解密
黏土风 App Remini 大火,最挣钱的却是这款产品,它做对了什么?
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢