作者:安迪的写作间

一狠心,开个大坑吧,写写 GPT 发家史,如何从最初少人知晓,偏居一方,直到被 BERT 点名才被大家知道,再到 GPT2 一战成名。之后 OpenAI 和 GPT 相关的一举一动就都倍受关注,一有消息,便成为热议,比如这次 DALL·E,还有之前 GPT3 连正式博客都没发就各种讨论。

我之前算半个 GPT 黑粉,因为觉得技术创新不高,不像 BERT 有 MLM 这样惊艳的想法,所以没觉得很厉害。现在,随着 OpenAI 一步步往上堆,到 GPT3 各种 demo 出来,再到 DALL·E 直接文本生成图片,我也只能直呼牛比,香,真香。事实证明了不断坚持做一件正确事情的重要性。

有趣的是, OpenAI 成立之初并非因为文本生成模型而知名,这点和 DeepMind 些许不同,后者专注强化学习一百年。而 OpenAI 一开始两条线是强化学习和生成模型(集中 GAN),而 GPT 开始也没受到太大关注,而是在探索中 OpenAI 发现了其可能性,便开始大力投入,到现在基本上一大半项目都与其相关。所以,现今大家提起 OpenAI 相信都是马上想起 GPT,再或者和马一龙(Elon Musk)早期有一腿,又多少人还能想起强化学习和GAN呢。

因为这样的发展,因此回顾 GPT 的发展史无疑是非常有趣的。这种始于微末,到之后野心庞大,仿佛要”天下布武“,文本音频图像统统都要的故事性。让我马上中二了,这种剧情太有戏剧性了,不正是:GPT 的野望!

这里贴出GPT的时间线,后面作者将一步步介绍GPT是如何发家的,感兴趣的可以戳原文。