GPT的历史和野望

作者：安迪的写作间

一狠心，开个大坑吧，写写 GPT 发家史，如何从最初少人知晓，偏居一方，直到被 BERT 点名才被大家知道，再到 GPT2 一战成名。之后 OpenAI 和 GPT 相关的一举一动就都倍受关注，一有消息，便成为热议，比如这次 DALL·E，还有之前 GPT3 连正式博客都没发就各种讨论。

我之前算半个 GPT 黑粉，因为觉得技术创新不高，不像 BERT 有 MLM 这样惊艳的想法，所以没觉得很厉害。现在，随着 OpenAI 一步步往上堆，到 GPT3 各种 demo 出来，再到 DALL·E 直接文本生成图片，我也只能直呼牛比，香，真香。事实证明了不断坚持做一件正确事情的重要性。

有趣的是， OpenAI 成立之初并非因为文本生成模型而知名，这点和 DeepMind 些许不同，后者专注强化学习一百年。而 OpenAI 一开始两条线是强化学习和生成模型（集中 GAN），而 GPT 开始也没受到太大关注，而是在探索中 OpenAI 发现了其可能性，便开始大力投入，到现在基本上一大半项目都与其相关。所以，现今大家提起 OpenAI 相信都是马上想起 GPT，再或者和马一龙（Elon Musk）早期有一腿，又多少人还能想起强化学习和GAN呢。

因为这样的发展，因此回顾 GPT 的发展史无疑是非常有趣的。这种始于微末，到之后野心庞大，仿佛要”天下布武“，文本音频图像统统都要的故事性。让我马上中二了，这种剧情太有戏剧性了，不正是：GPT 的野望！

这里贴出GPT的时间线，后面作者将一步步介绍GPT是如何发家的，感兴趣的可以戳原文。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

评论列表

评论