特邀报告 | 刘铁岩四两拨千斤：实现高效的NLP模型预训练

摘要： 近年来，在深度学习技术的加持下，自然语言处理（NLP）取得了突飞猛进的发展，在机器翻译、阅读理解等领域都在特定场景下接近甚至超越了人类的水准。然而，在此过程中， “大力出奇迹”的训练手段大行其道，人们在训练数据量、模型容量、算力上不断加码。比如，对于语言模型预训练而言，就从一亿参数的BERT模型一路增长至上千亿参数的GPT-3模型，所需的计算资源也从几十块GPU飙升至上万块GPU，单次训练的成本竟高达上千万美元。这类工作虽然从某种意义上探索着技术的边界，但也导致明显的马太效应，使得没有足够算力的研究者和学术机构逐渐失去话语权。为了打破这种不良局面，我们针对NLP模型训练的效率问题进行了深入的研究，从数据处理、模型结构、损失函数、优化算法等多个维度进行了探索，将训练效率提高了一个数量级；未来我们将致力于更大幅度的提速，从而助力NLP技术的平民化、为更加多样的技术创新奠定基础。

简历： 刘铁岩博士，微软亚洲研究院副院长，IEEE会士， ACM杰出科学家。他也是CMU、清华大学、中国科技大学的兼职教授。刘博士的先锋性研究促进了机器学习与信息检索之间的融合，被公认为“排序学习”领域的代表人物。近年来他在深度学习、强化学习等方面也颇有建树，在顶级国际会议和期刊上发表论文两百余篇，被引用数万次。他担任了WWW、ACL、SIGIR、KDD、NeurIPS、ICLR、AAAI、IJCAI等顶级会议的大会主席、程序委员会主席或领域主席；ACM TOIS、ACM TWEB、IEEE TPAMI等知名国际期刊副主编。他曾获得多项最佳论文和最高引论文奖、CCF青竹奖、中国AI英雄风云榜技术创新人物奖、AMiner全球最具影响力学者奖、CSDN技术领航者奖、机器之心最佳AI应用案例等奖项。他的团队开源了LightGBM，已成为Kaggle比赛和KDD Cup中最受欢迎的机器学习工具；帮助微软在中英新闻翻译任务上达到了人类专家水平，并获得WMT2019机器翻译比赛8项冠军；研发了史上最强麻将AI Suphx，在知名麻将平台“天凤”上荣升十段，稳定段位显著超越人类顶级选手。近年来他还与多个行业进行了战略研究合作（如华夏基金、东方海外、中国太平、顺丰、远传电信等）成功助力合作伙伴实现智能化转型。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

特邀报告 | 刘铁岩 四两拨千斤：实现高效的NLP模型预训练

评论

特邀报告 | 刘铁岩四两拨千斤：实现高效的NLP模型预训练