盘点2021年度AI十大成果

年底了，想看看各大咨询公司或者科技公司的发布的AI领域榜单，结果搜了一圈，发现还没人做这个系列的专题，故打算自己做一个「野鸡」榜单。

在小群里讨论了下，选出了今年AI界的一些成果。本来还给这些成果打分的，但考虑到我们不是什么权威机构，纯粹是几个技术爱好者讨论，打分容易引起争议，所以就放弃打分排序了，直接按成果发表/公布的时间排序。

本文的目的，不是为了比较哪个AI成果更牛，而是尽量让更多人了解到今年AI行业的进展，以及发展趋势。如榜单未必如大家所想的一样，或者漏了某个很强的技术，也欢迎大家补充你认为更厉害的AI成果，在评论区补充（当然，最近知乎评论区不能用，你可以用赞同+推荐的方式告诉我，好的东西我一定会补充进来）

年度10大AI成果（按时间排序）

1. Switch Transformers

发表时间：2021年1月11日

论文地址：Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity

亮点：

以将语言模型的参数量扩展至 1.6 万亿。
由于采用了混合专家（Mix of Expert，MoE）对于不同的输入，会选择不同的参数。多个专家（或者专门从事不同任务的模型）被保留在一个更大的模型中，针对任何给定的数据，由一个“门控网络”来选择咨询哪些专家。结果即使参数爆炸，但计算成本不变。

图源：https://syncedreview.com/2021/01/14/google-brains-switch-transformer-language-model-packs-1-6-trillion-parameters/

2. SEER(SElf-supERvised)

发表时间：2021年3月2号

论文地址：Self-supervised Pretraining of Visual Features in the Wild

亮点：

自监督，10亿个参数，在几乎没有标签帮助的情况下识别图像中的物体

博客：

https://ai.facebook.com/blog/seer-the-start-of-a-more-powerful-flexible-and-accessible-era-for-computer-vision/)

3. Swin Transformer

发表时间：2021年3月25号

论文地址：Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

亮点：

ICCV2021的 best paper
证明transformer模型在CV任务上表现能超过CNN
促进CV和NLP架构的融合

文章的几位作者现身知乎作答：

如何看待swin transformer成为ICCV2021的 best paper？910 关注 · 54 回答问题

4. SSViT

发表时间：2021年4月29号

论文地址：Emerging Properties in Self-Supervised Vision Transformers

亮点：

和SEER类似，也是无标签自监督的，不一样的是，此文章关注的是自监督用在vision transformer上。
文章有证据表明自监督学习可能是开发基于 ViT 的类 BERT 模型的关键。

5. MLP-Mixer

发布时间：2021年5月4号

论文地址：MLP-Mixer: An all-MLP Architecture for Vision

亮点：

虽然没有SOTA，但性能不错
卷积、循环，注意力什么的，都没用上。

不过Yann LeCun说，这种技巧只是「烹饪艺术」

6. GitHub Copilot

发布时间： 2021年6月19号

项目地址：GitHub Copilot.

在把Github Copilot选进来是，我是有点犹豫的，因为Github Copilot确实有很多争议，例如违反开源协议，代码抄袭等等。但从技术角度来看，这确实是一个不错的玩法，而且自动补全的代码很强，甚至还能刷LeetCode，我也用过一段时间，确实能帮助我提高写代码效率。当然，不要依赖它，毕竟它写的代码不能保证是没bug的。

相关视频讲解：

AI帮你写代码，程序员要失业了？

桔了个仔的视频

· 3.3 万播放

7. AlphaFold2开源

开源时间：2021年7月21日

项目地址：GitHub - deepmind/alphafold: Open source code for AlphaFold.

AlphaFold2虽然是去年的论文，但今年才公布源码。

亮点：

启发了其他团队在蛋白质预测方面的工作，例如启发了华盛顿大学蛋白质设计研究所主任大卫・贝克（David Baker）的团队研发出 RoseTTAFold 算法，这是一种计算成本更低的算法。RoseTTAFold和AlphaFold2是同一天开源的。
开源会极大促进新药研发，从而提高人类抗击疾病的能力。

8. 源1.0发布

发布时间：2021年10月10号

论文地址：Yuan 1.0: Large-Scale Pre-trained Language Model in Zero-Shot and Few-Shot Learning

亮点：

当了一天的的全球最大的NLP巨量模型（刚好下一天，MT-NLG发布了，笑死）
在零次学习和小样本学习里取得不错的效果，甚至在ZeroCLUE零样本学习榜和FewCLUE均拿下了除了人类之外的第一的成绩。(FewClue后被其他模型超过，太卷了）

如何评价浪潮发布的2457亿参数源1.0智能大模型？与GPT-3相比如何？处于AI模型领域什么水平？185 赞同 · 24 评论回答

9. MT-NLG

发布时间：2021年10月11号

文章地址（论文还没出来）：Using DeepSpeed and Megatron to Train Megatron-Turing NLG 530B, the World’s Largest and Most Powerful Generative Language Model - Microsoft Research

亮点：

参数高达5300亿，是最大的单体模型。
根据英伟达的博客介绍，MT-NLG在完成预测（Completion prediction)、阅读理解（Reading comprehension)、常识推理（Commonsense reasoning）、自然语言推论（Natural language inferences）、词义消歧（Word sense disambiguation）这几个方面都取得了「无与伦比」(unmatched)的成就。