新智元报道  

编辑:编辑部
【新智元导读】2024年,是大模型落地的关键一年,国内外的大厂都在动作频频。但要想打造出首个超级AI原生应用,还是要敢啃技术硬骨头,这已成业内共识。

AI社区的研究者们,这几天都在翘首以盼一条大新闻——
有传言说,谷歌用来对打ChatGPT超级大杀器Gemini Ultra,很可能会在24小时内上线!
而OpenAI的GPT-5,也已经在训练中了。大科技公司们磨刀霍霍,都在默默憋个大的。
而国内这边,目前已经有了200多个大模型。模型有了,下一步的发展趋势,已经不言自明。

图源:InfoQ研究中心
大佬们纷纷预测:2024年,国内即将出现首个杀手级应用。
如今各家都在摩拳擦掌。第一个杀手级应用会花落谁家?咱们来仔细分析一下。

第一个门槛:用户

大模型竞赛落地赛,最重要的是什么?
很多人都能想到,答案就是——用户。
作为史上用户最快过亿的初创公司,OpenAI早就看到了这一点。这也就是为什么,宫斗政变结束后,OpenAI立马火速推出了GPTs。
从此,应用开发者的门槛瞬间降低,没有编程能力的用户,也能在几分钟内创建出专属GPT。往长远了看,即使是广大普通用户,也能参与平台的商业分成。
因此,许多人将OpenAI推出的GPT store类比为苹果的App Store。
如今才短短几个月,全网已经诞生了300万+个GPT,OpenAI前景一片大好。
而且,类似的例子还有很多。
比如世界上最大的开源社区Hugging Face推出了「开源低配版」的GPTs——Hugging Chat Assistants。Quora旗下的AI产品Poe,也允许AI Bot的创作者获得分成。
而立志成为Gen AI时代新Quora+Wikipedia的Perplexity AI,则立志先做产品,后做模型。
国外这些大厂和初创企业的布局,无不在证明这一点:抢占应用入口,比大模型技术的领先更重要。
更进一步讲,想让这些从大模型上生长出来的应用落地,一方面需要大模型本身的性能足够强,另一方面还需要掌握生态入口,培养起用户的使用习惯。
随之而来的可观市场份额,就是自然而然的事。
在经历了一年的百模大战之后,中国的大模型行业也有了新的准入门槛。
第一个门槛,就是用户规模。
根据InfoQ研究中心的报告,目前国内的大模型在编程、知识、写作等方面的表现,可以说是已经非常亮眼了。
但逻辑能力依然是老大难问题,而多模态能力更是才刚刚开始搭建。

图源:InfoQ研究中心
因此,为了应对愈发复杂的场景,并解决更为高阶的任务,各家大模型的能力还需要不停地迭代。
而这就需要大量的用户交互与反馈。
报告指出,随着办公场景中,大模型开始更直接地与用户互动,模型的性能水平直线提升。
其实,文心大模型能在一年里以这么快的速度迭代优化,以这么快的速度把最新、最强的模型训练完成,离不开飞桨的支撑。飞桨、文心之间,本质上都是共创的。文心很特别的生态,就是数据生态。
在这个过程中,高质量、权威性、宝贵的知识能够被模型学习到,模型的性能也就随之增强。而大模型的能力,还会反哺出更多共创生态。
为了实践这一点,今年8月,百度发布了文心大模型的星河共创计划,希望把丰富的大模型资源和产业生态资源链接起来。
文心一言拜了10位导师,分别来自10个行业,都是在各自领域顶尖的学者和专家。
性能逐渐强大的文心一言,承载起了越来越多的业务场景。
去年12月28日,百度首席技术官王海峰在第十届WAVE SUMMIT深度学习开发者大会上宣布文心一言用户规模突破1亿。
作为首个用户规模破亿的大模型,文心一言背后有着多个技术优势,如知识增强、检索增强、对话增强。
现在,文心一言的基础模型已升级到文心大模型4.0,在输入和输出阶段,都进行了知识点增强。
如今,越来越多的用户在信任和使用文心一言。
最新一项统计数据也显示了这一点。在目前的市场上,近半数的受访开发者表示,他们了解或使用过GPT 系列大模型和百度文心大模型这两款模型,领先优势明显。

图源:InfoQ研究中心
可见,随着百模大战在2023年下半年正式掀开序幕,基于大模型打造应用也呈井喷式爆发增长。
如今,这些产品已经在娱乐、教育等热门的场景里有了广泛的应用。2024年,我们很可能就将迎来全民的AI浪潮,快速聚集超级量级的用户规模,并且出现更加强大、更具创新性的AI工具。

图源:InfoQ研究中心
而率先突破亿级用户规模的文心一言,很明显已经在超级应用的最终竞赛中,拿到了入场券。

第二个门槛:API的调用量

除了刚刚提到的用户量,百模大战的第二个门槛,就是API的调用量了,或者更确切地说,是企业级用户的服务数量。
其原因在于,金融、教育、医疗、能源等行业的大量企业,已经开始意识到大模型产品的价值,并且开始积极倡导使用大模型产品,来提高员工的工作效率。
随着企业对数字化转型的需求不断增长,大模型产品在企业级市场的应用场景也在不断拓展。

图源:InfoQ研究中心
而大模型厂商,谁能满足各行业智能化升级的需求,谁就能迈出商业化的第一步。
在ToB侧,2024年的企业级需求落地,将成为重要的行业风向。
国外大模型行业的两个巨型独角兽——OpenAI和Anthropic为例,他们通过开发出成功满足了商业客户具体需求的产品,证明了大模型的商业价值。

OpenAI已经成为一家年化收入16亿美元的吸金巨兽
例如,根据OpenAI的介绍,在GPT-4的帮助下,摩根士丹利正在改变财富管理人员获取信息的方式。
摩根士丹利用自己专有的数据训练了GPT-4,让自己内部的聊天机器人尽可能地满足摩根士丹利定制化的需求。
这能进一步稳固摩根士丹利顾问与客户之间的关系,使他们能够更快地帮助和服务更多的人。
而由OpenAI的创始人出走后新创立的另一家大模型巨型独角兽Anthropic,就更是将企业级客户作为他们的立身之本。
Lonely Planet是一家一流的旅游媒体公司,他们的产品包括了800多本提供专业旅游建议和指导的旅游书籍,是全球旅游爱好者最信任的工具。
在Anthropic的Claude 2模型的加持下,Lonelyplanet可以根据客户偏好,在数字平台上以各种方式重新包装和个性化他们的内容,快速而准确地服务更多的顾客。
可以看到,只有能为用户实际创造价值的模型,才能完成从「技术」到「产品」,从「产品」到「有价值的产品」的商业化落地。
在这一点上,国内的文心大模型已经走在了商业化的最前端。
百度创始人、董事长兼首席执行官李彦宏曾在深圳2023西丽湖论坛上表示,自从8月31日开放以来,文心大模型的API调用量呈现了指数级的增长,
「国内有200多个大模型,上了这个榜单、进了那个排名,但其实调用量是很小的。文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。」
如此之大的API调用,是大量国内企业级用户用「脚」投票的结果。
2023年3月,百度智能云推出「千帆大模型平台」,是全球首个一站式的企业级大模型平台。
自8月31日文心一言向全社会全面开放以来,在千帆大模型平台上,大模型API日调用量增长10倍。
目前千帆平台已累计服务超过4万家企业用户,累计帮助企业用户精调近1万个大模型。
生态建设是大模型发展繁荣的根基。
前面提到的文心大模型星河共创计划,就是希望把丰富的大模型资源和产业生态资源进行链接,与广大开发者共同推动人工智能应用创新。
目前,星河社区里基于文心一言的创新应用已经超过4000个,覆盖市场营销、教育培训、智能办公等众多场景。
而在如此之多的开发者和企业应用之中,已经孵化出了很多百万级用户量的应用。
这些应用把文心大模型的能力聚焦于一个个的商用场景,充分地满足了企业用户的需求,完成了从「技术」到「有价值产品」的商业化落地。
去年10月,苏哒智能通过ERINE SDK研发推出了一款提供专业长文写作能力的AI应用——「文思助手」,同时在文心一言插件商城和飞桨星河社区上线。
目前,「文思助手」不仅实现了用户人数破万,而且在飞桨星河社区上,一个小时内token消耗便可达40万,迅速成为应用「小爆款」。
金融投资机构介绍,「文思助手」可以让原本三天的工作量,在短短两三个小时即可完成,极大地提升了工作效率。
其中,在行研报告撰写阶段,AI根据知识库仅需五分钟便可一键生成初稿。修订阶段,一小时内基本可以完成内容的校对、调整和补充,一键导出即可分享给团队。
作为全球手机销量排名第二的品牌,三星也选择了百度文心大模型加持的百度智能云来服务中国市场。
在百度文心大模型的加持下,Galaxy AI不仅可提供端侧赋能的通话、翻译功能,还给用户带来全新的智能摘要、排版等生成AI体验。
其中最受瞩目的「即圈即搜」功能,让用户只需在文字、图片或视频上进行简单的手势操作,如画圈、划线等,即可立即获得精准的搜索结果。
与此同时,荣耀手机也将百度文心大模型的能力深度集成在了最新推出的Magic OS中。
在消费品行业之外,文心大模型对于工业和基础设施供应商的加持也得到了企业用户的认可。
百度与山东省港口集团将基于百度智能云千帆大模型平台,在港口日常管理、经营分析、生产运行、智慧办公、物流服务等领域共同开展大模型港口实践,并实现共同推广应用,赋能港航领域上下游产业链和生态企业。
李彦宏曾表示,如果大家都去训练大模型,可能是一种资源浪费。
同理,如果大家都去做无法落地的应用,也是一种浪费。
我们真正需要的优质AI原生应用,需要能真正改变大家的工作和生活,只有这样,才能真正落地。
比如,在企业用户的工作场景中、在学生学习生活中、在生产制造中等等,这些场景已经凸显出来。
随着在这些场景上提效、降本、为创作能力带来新的可能,就会涌现出更多的机会。大家的想象力也会放飞起来。

2024大模型格局猜想

就像OpenAI一样,只有坐拥巨量用户规模、最前沿的模型性能,以及充分满足企业客户的能力,才能不断迭代技术和产品,持续造血。
大模型越是落地应用,对基础模型的技术能力要求越高,对开发者、企业的服务能力也要求越高,百度文心大模型也就越有优势。
说到这里,国内能有机会走到最后的是谁,答案已经呼之欲出。
参考资料:
https://www.infoq.cn/minibook/0xhGee6fTUuzDNbj7FdU
http://www.xinhuanet.com/tech/20231229/f48df58a018847888c0c00edbcff3aa8/c.html
https://finance.sina.com.cn/tech/it/2023-12-28/doc-imzzpyuc6959648.shtml