CPM-Live 

  CPM-Live   CPM-Live 

第二期训练启动

 
上次还是初夏,我们发送第一封直播邀请函,埋下希望的种子,而今转眼就到了深秋—— 收获的季节 
 
在这短短数月,OpenBMB 与广大关注者见证了彼此的耕耘和汗水。OpenBMB  团队耗时 68 天、花费 40 余万人民币完成了百亿大模型 CPM-Ant 的训练,社区的同学也积极参与,为 CPM-Ant 送出了 400 多个点赞,以及 100 余条新版本功能倡议。终于,我们一同收获了一期训练的累累硕果,也迎来第二期直播训练 CPM-Bee 的启动。
 

 

 

CPM-Bee 

  CPM-Live   CPM-Live 

三大新特性

 

作为首个直播训练中文大模型,CPM-Ant 具有计算高效、性能优异、部署经济、使用便捷、开放民主五大卓越特性, 在大模型训练、微调、压缩、推理、应用等环节均提供了一份实践参考方案。
 
从 Ant 🐜 到 Bee 🐝 的形象喻指,也体现出我们的预期与展望:通过持续学习,模型将会不断变大变强。

- 二期功能问卷投票结果

 

在充分考虑 OpenBMB 社区意见和团队的精心设计下,CPM-Bee 的训练中将新增 任务模式增强、多语言融合、复杂结构处理 等 新特性 。具体来说,CPM-Bee  的新特性如下:
 

 01  任务模式增强 

在 CPM-Bee 中,我们会在预训练过程中引入各类常见任务模式的数据增强,包括分类、生成、问答、对话、摘要、扩写、翻译,支持 CPM-Bee 在各类文本处理任务上开箱即用,提升结合少量样本的高效参数微调的性能。
 
 02  多语言融合 
在 CPM-Ant 中,我们着重构建以中文为核心的大模型。在 CPM-Bee 中,我们将逐渐加入英文以及其他语种的数据(包括各语言独立数据及跨语言平行数据),最终形成以中文为核心,多语种兼顾的大规模预训练语言模型。
 
 03  复杂结构处理 

已有的预训练语言模型主要立足于利用非结构化文本进行训练,因而对于半结构化及结构化数据的处理能力较弱。在 CPM-Bee 中,我们会加入各类半结构化及结构化数据的处理功能,以更好地支持网页、代码等结构化复杂文本的处理能力。

- 结构化训练数据样例


 

CPM-Bee 

  CPM-Live   CPM-Live 

实时训练过程

 

为支持 CPM-Bee 的实时展示,我们更新了网站页面。训练启动后,我们将延续第一期的网页直播形式,官网以图表、数值等直观形式,实时展示 训练过程中 GPU数、吞吐量、损失值 等动态数据,方便大家随时前来“围观”。每天傍晚,我们将上传前一天的“训练日志”,各位朋友不妨多来“批改作业”。我们还额外增加了模型能力展示页面——模型每日一测 :每天针对不同 case 更新模型结果,更加直观地展示模型不断学习、不断进步的过程。在下图中可以看出,页面右上初始模型的生成结果并不佳,但随着时间的推移,我们相信,这个众目注视下的“养成系”模型会越来越强大。

- 官网实时展示训练动态数据

 ➤ 传送门   官网链接 
🔗 https://live.openbmb.org 
欢迎前来我们 CPM-Live 项目的 GitHub,期待您使用代码、发起或参与讨论!您的试用和意见,甚至批评,都是我们最珍视的行动和声音,都将助力国产大模型从中国的一隅走向世界的大舞台!

蚁行千里人以为一寸,路漫漫其修远兮。我们已经见证了 Ant 🐜 的稳健爬行,未来我们将一起推动大模型 CPM-Bee 🐝 的起飞。

 

与君同行,与有荣焉!

OpenBMB 团队敬上

2022年10月13日

 


 

 

 ➤ 传送门   GitHub 链接 

🔗 https://github.com/OpenBMB/CPM-Live
 

 ➤ 传送门   CPM-Bee 计划书 

🔗 https://github.com/OpenBMB/CPM-Live/blob/master/plans/CPM-Bee%E8%AE%AD%E7%BB%83%E8%AE%A1%E5%88%92%E4%B9%A6.md

 


 

OpenBMB 小编碎碎念 
1. 果您想为大模型直播训练加油打 call,关注本文公众号,回复 “加油群” ,添加小助手即可等待加入 CPM-Live训练加油群
2. 果您想和更多热爱大模型的同仁交流 ,关注本文公众号,回复 “大模型” ,添加小助手即可等待加入 学习群
3. 果您想系统学习大模型,欢迎关注我们的 B站账号 “OpenBMB” ,其中已更新全部 课程视频和配套资源
4. 果您或您的组织有意愿提供算力、数据与资金等支持,欢迎联系邮箱 openbmb@gmail.com
 

 

 

 

官方网站

https://www.openbmb.org

 

技术文章

CPM-Ant 训练完成 BMInf 适配GLM-130B

高效训练工具 BMTrain BMTrain 技术原理

CPM-Live 邀请函 CPM-Live 训练启动

OpenBMB 社区介绍 | 大模型课程

大模型榜单 BMList

长期开放招聘含实习

开发岗  |  研发岗  |  运营岗

交流QQ群
735930538
本期内容编辑|谭欣佩
欢迎转载
商务合作请联系
openbmb@gmail.com
 
👏期待您的关注与加入👏