GPT-4 闪亮登场：比 Chat GPT 更大更好，但 OpenAI 还是不说为什么！

【编者按：神秘的OpenAI大型新语言模型 GPT-4 在人们的期待中北京时间今天凌晨震撼登场。继 ChatGPT 开发者 API 开放没多久之后，OpenAI 这次发布了最新的 GPT-4 对话机器人服务以及其开发者 API，让人目不暇接。它打破了之前版本的记录，其模型更加庞大、功能更为强大惊艳。MIT 技术评论杂志记者有机会在GPT-4发布前后采访OpenAI 的相关人员来了解该大语言模型的一些情况，并在第一时间发表报道“GPT-4 is bigger and better than ChatGPT—but OpenAI won’t say why (GPT-4比Chat GPT更大更好，但OpenAI不说为什么）” 试图介绍神秘的 GPT-4一些情况。同行们对此也已期待已久，虽然觉得 GPT-4 现在是所有基础大模型评估的标准，GPT-4 已成为新的里程碑，OpenAI 将继续引领人工智能的发展方向，但也更加抱怨其开放性，这一次它的工作原理更加深入地被封存了起来，“在没有看到技术细节的情况下，很难判断这些结果到底有多令人印象深刻”，有朋友甚至调侃，OpenAI 应该改为 ClosedAI ... 我们特将该内容编译出来和各位客户、合作伙伴朋友分享。如需转载，请联系我们（ID：15937102830）】】

OpenAI 终于发布了下一代大型语言模型GPT-4。它的上一个惊喜是ChatGPT，它总是很难被效仿，但这家总部位于旧金山的公司已经让GPT-4变得更大更好。

但OpenAI不愿透露它的规模有多大，以及为什么会更好。GPT-4是该公司有史以来发布的最神秘的版本，标志着其从非营利研究实验室向营利性科技公司的全面转型。

OpenAI的首席科学家 Ilya Sutskever 在GPT-4团队宣布消息一小时后的视频通话中对我说：“你知道，这是我们目前无法评论的事情。”“外面的竞争相当激烈。”

加入等候名单的用户和付费ChatGPT Plus的付费用户都可以使用GPT-4，但只能使用有限的文本功能。

GPT-4是一个多模态大型语言模型，这意味着它可以同时响应文本和图像。给它一张你冰箱里食物的照片，问它你能做什么，GPT-4就会尝试用照片上的食材做出食谱。

艾伦人工智能研究所(Allen Institute for AI)的Oren Etzioni 表示:“在许多方面的持续改进是显著的。”“GPT-4现在是所有基础模型评估的标准。”

开源大型语言模型BLOOM背后的人工智能初创公司hugging Face联合创始人 Thomas Wolf 说:“在过去几年里，一个好的多模态模型一直是许多大型科技实验室的圣杯。”“但它仍然难以捉摸。”

从理论上讲，将文本和图像结合起来可以让多模式模型更好地理解世界。“它也许能够解决语言模型的传统弱点，比如空间推理，”Wolf 说。

目前还不清楚GPT-4是否也是如此。OpenAI的新模型在一些基本推理方面似乎比ChatGPT更出色，可以解决一些简单的难题，比如用相同字母开头的单词总结文本块。在我的演示中，我看到GPT-4总结了OpenAI网站上的公告，使用了以g开头的单词：“GPT-4，突破性的代际增长，获得了更大的成绩。护栏，指引和收获。巨大的，开创性的，具有全球性的天赋。”在另一个演示中，GPT-4接受了一份关于税收的文件，并回答了相关的问题，并给出了其回答的理由。

在人类考试中，它的表现也优于ChatGPT，包括统一律师考试（其中GPT-4排名第90百分位，ChatGPT排名第10百分位）和生物奥林匹克竞赛（其中，GPT–4排名99百分位和ChatGPT排名31百分位）。“令人兴奋的是，现在开始在人类为自己使用的相同基准上进行评估，”Wolf 说。但他补充说，“在没有看到技术细节的情况下，很难判断这些结果到底有多令人印象深刻。”

根据OpenAI的说法，GPT-4比基于该公司之前技术GPT-3版本的ChatGPT表现更好，因为它是一个更大的模型，具有更多的参数(神经网络中的值在训练过程中被调整)。这遵循了该公司在之前的模型中发现的一个重要趋势。GPT-3的表现优于GPT-2，因为它比GPT-2的15亿个参数大了100多倍，有1750亿个参数。GPT-4的开发者之一Jakub Pachocki说:"多年来，这个基本公式并没有真正改变多少。"“但这仍然像建造一艘宇宙飞船，你需要把所有这些小部件都弄好，并确保没有一个坏掉。”

但是OpenAI选择不透露GPT-4的规模。与之前发布的版本不同，该公司没有透露任何关于GPT-4是如何建造的——没有数据，没有计算能力，也没有训练技术。“OpenAI现在是一家完全封闭的公司，其科学交流类似于产品新闻稿，”Wolf说。

OpenAI说，他们花了六个月的时间使GPT-4更加安全和准确。根据该公司的说法，GPT-4对OpenAI不允许的内容请求的响应率比GPT-3.5低82%，编造内容的可能性低60%。

OpenAI表示，它使用了与ChatGPT相同的方法，通过人类反馈使用强化学习。这涉及到要求人类评分员从模型中获得不同的回答，并使用这些分数来改进未来的输出。

该团队甚至使用GPT-4来改进自己，要求它生成导致偏见、不准确或冒犯性反应的输入，然后修复模型，使其在未来拒绝这样的输入。

GPT-4可能是迄今为止构建的最好的多模态大型语言模型。但它并不像GPT-3在2020年首次出现时那样独树一帜。过去三年发生了很多事。如今，GPT-4与其他多模式模型并列，包括DeepMind的Hugging Face 模型。Wolf说，Hugging Face正在开发一个开源的多模式模型，其他人可以免费使用和调整。

面对这样的竞争，OpenAI更多的是把这个版本当作一次产品发布会，而不是一次研究更新。GPT-4的早期版本已经与OpenAI的一些合作伙伴共享，包括微软，微软今天证实，它使用了GPT-4版本来构建Bing Chat。OpenAI目前还在与Stripe、Duolingo、Morgan Stanley和冰岛政府(使用GPT-4帮助保存冰岛语)等机构合作。

“启动这种规模的模型的成本对于大多数公司来说是难以承受的，但是OpenAI所采取的方法使得大型语言模型对初创公司来说非常容易，”投资公司Tola Capital的联合创始人 Sheila Gulati 说。“这将在GPT-4的基础上催生巨大的创新。”

然而，大型语言模型仍然存在根本性缺陷。GPT-4仍然可以生成有偏见的、虚假的和令人厌恶的文本；它也仍然可以被黑客入侵以绕过它的护栏。尽管OpenAI改进了这项技术，但它并没有完全修复它。该公司声称，其安全测试已经足够的GPT-4用于第三方应用程序。但它也准备好了迎接意外。

“安全不是一个二元的东西；它是一个过程，”Sutskever说。“当你达到一个新的能力水平时，事情就会变得复杂。其中很多功能现在都已经被很好地理解了，但我相信其中的一些仍然会让人感到惊讶。”

甚至 Sutskever 也表示，放慢发布速度有时可能是更好的选择：“在这样一个世界里，公司会想出某种程序，允许那些具有完全前所未有的能力的模型缓慢发布，这将是非常可取的”。

想要了解更多，欢迎入群交流！

权益福利：

1、AI 行业、生态和政策等前沿资讯解析；

2、最新 AI 技术包括大模型的技术前沿、工程实践和应用落地交流（社群邀请人数已达上限，可先加小编微信：15937102830）

关于MoPaaS魔泊云

源于硅谷、扎根中国，上海殷泊信息科技有限公司(MoPaaS)是中国领先的人工智能（AI）平台和服务提供商，为用户的数字转型、智能升级和融合创新直接赋能。针对中国AI应用和工程市场的需求，基于自主的智能 PaaS 云平台专利技术，MoPaaS 在业界率先推出开放的AI平台为加速客户AI应用项目落地提供高效的GPU算力优化和模型开发运维 (ModelOps) 能力和服务。MoPaaS AI平台已经服务在教学科研、工业制造、能源交通、互联网、医疗卫生、政府和金融等行业超过300家国内外满意的客户的AI技术研发、人才培养和应用落地工程需求。MoPaaS 致力打造全方位开放的AI技术和应用生态圈。MoPaaS 被Forrester评为中国企业级云平台市场的卓越表现者（Strong Performer)。

END

▼ 往期精选 ▼

1、图灵奖获得者 Yoshua Bengio 认为 ChatGPT 是一个“警钟”

2、口述历史，探析ChatGPT的创造历程，ChatGPT的内部故事

3、对话式人工智能时代已经到来

4、基辛格: ChatGPT 预示着一场智能革命，而人类还没有准备好

▼点击下方“阅读原文”，查看文章来源！

内容中包含的图片若涉及版权问题，请及时与我们联系删除

GPT-4 闪亮登场：比 Chat GPT 更大更好，但 OpenAI 还是不说为什么 ！

评论列表

评论

GPT-4 闪亮登场：比 Chat GPT 更大更好，但 OpenAI 还是不说为什么！