本文转自“全球风口”公众号,科技创新产业专家、海银资本创始合伙人、前哨科技特训营主理人王煜全的自媒体平台。

科技前哨分享新兴科技企业有关的新鲜见闻,眼下就有一个很好的案例帮助我们前瞻人工智能的新机会,那就是新兴的人工智能平台Hugging Face。

1.Hugging Face有多火?

Hugging Face可能很多人都不太了解,这个人工智能平台其实是今天互联网上成长最快的新平台。

Hugging Face的诞生和人工智能模型越来越大有密切关系。

2018年,谷歌开源了自家3.4亿参数的自然语言模型BERT,开启了大厂之间模型参数内卷的竞争,Open AI、英伟达、谷歌、微软等行业知名公司纷纷加入其中,让人工智能参数模型一度超越千亿规模。

这是什么水平呢?Open AI的GPT-3模型训练一次的电费就要50万人民币。

这么巨大的开发成本也让很多中小企业望而却步,毕竟没有谁承担得起这么高的开发费用。在这样的大环境下,Hugging Face做起了提供人工智能模型的服务,无需其他企业再度开发,他们直接提供可用模型,让不少企业和他们建立了深度合作关系。

目前,Hugging Face 已经开放了10万个预训练模型和1万个数据集,用户可以自行创建、协作、部署和优化人工智能模型。

超过1万家公司正在使用Hugging Face的技术支持获得人工智能能力,这也让它成为了人工智能开发不可或缺的生态平台。

凭借这个庞大的生态,Hugging Face最近完成了1亿美元的C轮融资,并公开了其领导的BigScience项目,这个项目将帮助举办合作研讨会,营造更丰富的学术生态,目前已经有1000多名不同背景和学科的研究人员加入。

2.从青少年到开发者

如今的Hugging Face体量已经不小,但在2016年刚建立时,它的业务和现在比可以说是风马牛不相及。

当时的Hugging Face只是一个面向青少年的聊天机器人移动应用程序,通过人工智能开发的聊天助手为青少年提供情感疏导、娱乐服务。

这个业务在当时看确实是挺时髦的项目,2017年知名的AI大佬吴恩达也曾加入一家智能聊天机器人公司Webot。

然而从商业上来说这项服务没有找到太好的变现方法,人工智能技术不成熟也让这种聊天机器人显得不太聪明,聊天内容稍微跳脱固定场景,AI就无法给予很好的反馈,就只有一部分对AI感兴趣的青少年用户留在这上面。

2019年,Hugging Face的创始人做出了一个大胆的举动,开放了聊天机器人的AI模型,让用户可以自行开发服务,当时的想法很简单,他们自己没法开发出足够好的人工智能,可以借助用户共创的方法,提供更好的服务。

这个过程中他们获得了出乎意料的正面反馈,由于当时开源可用的人工智能模型太少,Hugging Face很快就成为了很多开发者研发人工智能的地方,创始人团队也果断放弃原有业务,跟进用户需求,收集更多的自然语言模型,并将聊天平台转化为开发者社区,形成了全网最大的自然语言处理的开源模型数据库,这也正式Hugging Face作为一个开源社区最强大的竞争力之一。

3.创始人团队

公司的创始人都是硅谷创业老兵,CEO Clément Delangue创立过笔记平台VideoNot,被谷歌收购的移动开发平台Moodstocks;公司首席技术官Julien Chaumond大学毕业就在硅谷创业,2015年结束创业生涯从事起了人工智能应用开发,在产业界和学术界都取得了不小的成绩,他的多篇论文累计引用量破万。

2017年加入的Thomas Wolf则是一名自然语言处理界的大牛。其他成绩都不用提,他2022年出版的新书《Transformer自然语言处理》是业内开发者都打出好评的作品,也正是他的加入帮助Hugging Face加快了开发者社区的构建之路。

4.Hugging Face的商业化与产品业务

不同于传统的公司企业,作为一个开源社区,Hugging Face的商业化尝试还处于萌芽阶段。

2021年之前,Hugging Face没有任何收入,全靠烧投资人的钱来保持社区的正常运营,不过三名创始人有非常丰富的创业经验,对资金规划非常详细,公司仅有30名员工,主要靠900多名社区贡献者帮助开发,极大降低了成本。

2021年,Hugging Face才开始初步探索商业化。

目前,Hugging Face主要的盈利业务有三类,一是付费制会员,提供更加优质的服务和社区体验;二是数据托管,根据不同参数需求提供不同的按小时收费托管服务。

三是人工智能解决方案服务,这是他们目前的主打产品,可以根据用户需求提供已经成型的AI,也可以提供用户自行训练的AI,直至最后帮助用户自行定制。

从数据上来看,2021年Hugging Face已经实现收入1千万美元,付费客户主要是大型企业,目前它拥有的1000多家客户,包括英特尔、高通、辉瑞、彭博社和eBay,可以说是非常标准的开源商业模式。

通过营造好的开发者生态将自己变成技术标准和服务提供者,再面向企业提供开发服务,收取服务费用。这套模式英伟达在GPU的AI生态上实践成功了,Hugging Face也通过AI应用开发得以走通。

但开源生态也有它自己的软肋,商业化发展太快往往需要对技术有更强的管控力,就会伤害到自然生长的社区环境,在构筑自己的竞争壁垒时,能否尽可能长久维系自己的开源生态直观重要。

Hugging Face的做法是向科研领域深挖,这是一个很好的尝试,然而人工智能的前沿并不完全倍科研领域主导,很多大型企业本身也是前沿的研发机构,这让它在技术上很难保持领先,未来同样面临被收购的风险。