瞄准GPT-3落地难题，首个千亿中文大模型「盘古」问世

最近的中文 NLP 社区有点热闹：「中文版 T5」、「中文版 GPT-3」以及各种大规模中文版预训练模型陆续问世，似乎要带领中文 NLP 社区跑步进入「练大模型」时代。在此背景下，中文语言理解测评基准「CLUE」也经历了它的前辈「GLUE」所经历过的盛况：一个模型的冠军宝座还没坐热，就被一个更新的模型挤了下去。

这次刷榜的，是一个叫「盘古」的 NLP 模型。在最近的 CLUE 榜单上，「盘古」在总榜、阅读理解排行榜和分类任务排行榜上都位列第一，总榜得分比第二名高出一个百分点。

除此之外，它还拿到了 NLPCC 生成任务的第一名，文本摘要的分数相比基线提升了 60%。这是业界首个千亿参数的中文大模型，拥有 1100 亿密集参数，由循环智能（Recurrent AI）和华为云联合开发，鹏城实验室提供算力支持。为了训练这个模型，田奇（华为云人工智能首席科技家）与杨植麟（循环智能联合创始人）联合带领的研究团队花了近半年的时间，给模型喂了 40TB 的行业文本数据和超过 400 万小时的行业语音数据。

更多详情可以戳原文。

来源：机器之心

内容中包含的图片若涉及版权问题，请及时与我们联系删除

瞄准GPT-3落地难题，首个千亿中文大模型「盘古」问世

评论列表

合并

【资讯推荐】瞄准GPT-3落地难题，首个千亿中文大模型「盘古」问世，专攻企业级应用

评论