新智元报道
新智元报道
【新智元导读】2B性能小钢炮来了!刚刚,面壁智能重磅开源了旗舰级端侧多模态模型MiniCPM,2B就能赶超Mistral-7B,还能越级比肩Llama2-13B。成本更是低到炸裂,170万tokens成本仅为1元!

以小博大,超强端侧大模型诞生
今天发布的MiniCPM不仅是端侧模型,更是旗舰模型! 
首先就是性能上展现的旗舰——以小博大。 提到以小博大最好的标杆,必然是2023年在AI开源社区大火、被公认为「开源模型新王者」的Mistral-7B。 
仅用2B的规模,以及1T tokens的精选数据,MiniCPM就在多项主流评测榜单上,全面地超越了Mistral-7B。 
跟微软发布的Phi-2相比,MiniCPM在中文能力上具有极大的优势。 
甚至,MiniCPM还可以跟20B、40B、50B的一些模型「掰手腕」。 在英文榜单的平均分上,它的得分超越了Llama2-13B、Falcon-40B。 
在HumanEval、MBPP等代表了代码、逻辑能力的榜单上,MiniCPM都表现亮眼。 
此外,在最接近用户体感的MT-Bentch上,MiniCPM也取得了很好的成绩。 
这次,MiniCPM也是首次把多模态的能力,集成到了端侧模型中,并在手机上付诸实施。 
多模态性能同体量下没有对手,所以只能越级PK。 在多模态基准测试中,2.8B规模的MiniCPM-V展现出了3倍于它体量的模型能力。 
总之,MiniCPM是无愧于「性能小钢炮」这个称号! 
全能旗舰,能说会看










全能旗舰,能说会看
MiniCPM模型究竟有多强,还得看看它具体实力如何。
语言能力




自己写自己的代码

人生要有PlanB:野外生存直接开挂




CPU搞定推理,1080Ti玩转训练微调
成本,就是大模型的隐形竞争力。 面壁智能在做商业化实践的时候,发现客户都十分关注应用模型的成本。 虽然千亿模型效果很好,但真正大规模去部署时,成本会是一个绕不开的巨大障碍。 而MiniCPM很好地解决了这个障碍,让模型的推理成本实现断崖式的下降。 在提供非常强劲的模型的同时,还能支持CPU推理,是实打实的「省钱大模型」。 其中,MiniCPM的int 4量化版本,在性能几乎无损的情况下压缩了75%的尺寸,大大降低了模型对于内存和闪存的需求。 
以搭载骁龙855芯片的手机为例,处理170万tokens的成本仅为1块钱,几乎只有在云端运行的Mistral-Medium的1%。 
除了端侧推理的成本非常低,MiniCPM持续改进的成本也控制也异常得好。 一台电脑、一张普通的消费级显卡就能完成SFT,彻底拯救算力焦虑。 
进行Int4量化后,MiniCPM只占2GB空间,具备了在端侧手机进行模型部署的条件。 对此,团队在Android和Harmony系统上使用开源框架MLC-LLM进行模型适配,在iPhone系统上使用开源框架LLMFarm进行模型适配,并分别选取了部分端侧手机设备进行了测试。 从结果来看,MiniCPM已经跑通了国际主流的手机品牌和终端CPU芯片,即使是老手机运行起来也毫无压力。 
复刻Gemini演示,全程无剪辑




复刻Gemini演示,全程无剪辑

这张图片看起来很幽默,因为它显示的是一只狗与人的身体,狗站起来靠在门框上。这是一张经过数字处理或 「Photoshop 」的图片,将狗的头部与身穿蓝色T恤和黑色短裤的人的身体结合在一起。 狗与人身体的不协调,再加上狗严肃的面部表情,使这幅图像变得滑稽可笑。它利用了荒诞和出人意料的情境,而这正是幽默的常见来源。

图中有两个人,一个人坐在椅子上,另一个人走在路上。

照片中可以看到一个人。这是一个从后面看到的坐在长凳上的男人。他身穿绿色条纹衬衫和深色裤子,旁边长凳的一侧披着一条蓝色毛巾或布。 他还戴着口罩,这表明照片可能是在戴口罩在公共场合很常见的时期拍摄的。照片画面中看不到其他人。

照片拍摄的是中国北京故宫宁静的冬景。故宫是联合国教科文组织世界文化遗产,巍然屹立在背景中,红色的墙壁和屋顶与阴霾的天空形成鲜明对比。地面上覆盖着一层白雪,为画面增添了一丝宁静。 前景中,一群人正走向紫禁城,寒冷的空气中,他们的呼吸清晰可见。其中,有一个人正在用手机捕捉这一刻,或许是为了珍藏记忆,或许是为了与亲朋好友分享。 画面从低角度仰望故宫,突出了故宫的宏伟和历史意义。这一视角还能清晰地看到前景中的人物,使场景更具规模感和纵深感。 图片上有「CCTV 2 」和「CCTV.COM 」的水印,表明很可能是由中国中央电视台拍摄的。水印还表明,该图像可能是新闻报道或纪录片的一部分。


画面中,一名女士和她的狗正在穿过城市街道上的人行横道。这名女士身穿条纹衬衫和蓝色牛仔裤,右手拿着一根白色手杖。她的爱犬是一只棕褐色的拉布拉多犬,拴着皮带,戴着黑色安全带。她们都在向画面右侧移动。 她们穿过的人行横道上有白色条纹,位于一栋灰色建筑前。街道两旁绿树成荫,为城市环境增添了一丝自然气息。艳阳高照,投射出温暖的光辉。 画面捕捉了这位女士和她的爱犬在城市中相伴前行的瞬间。女人使用的拐杖表明她可能有视力障碍,而狗的背带表明它受过训练,可以帮助她。他们穿过人行横道的旅程见证了他们的团队合作和共同的纽带。

以小博大,实力在哪?
端侧模型的发展,已经半年多了。去年七月开始,很多厂商都入局了端侧大模型。 面壁智能这一系列在大模型上取得的突破,都来源于他们强大的团队和多年的技术积累。 2021年,面壁智能就构建了高效的技术优势,集中在Infra、算法和数据方法论这三个方向中。





「宇宙中心」大模型+ Agent早期实践者
在2023大模型元年里,五道口大模型Vally纷纷汇聚了百川智能、面壁智能、智谱华章等中国主流大模型创业公司,以及智源研究院这样杰出的研究机构。 若说其中,最早开始大模型+ Agent的研究者,便是面壁智能了。 成立于2022年8月,这家初创公司的创始团队来自于清华计算机系,这样的强大背景就注定了它将来的不凡。
明星团队,「双CP」领军组合



One More Thing
春节假期马上就到了,过年嗑瓜子,不如嗑「CP神器」——心间。 在这个App上,不光有李白杜甫、清华北大的CP,或许,你还可以找到平行宇宙的ta。 
参考资料: https://github.com/OpenBMB/MiniCPM https://github.com/OpenBMB/OmniLMM





内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢