【编者按:神秘的OpenAI大型新语言模型 GPT-4 在人们的期待中北京时间今天凌晨震撼登场。继 ChatGPT 开发者 API 开放没多久之后,OpenAI 这次发布了最新的 GPT-4 对话机器人服务以及其开发者 API,让人目不暇接。它打破了之前版本的记录,其模型更加庞大、功能更为强大惊艳。MIT 技术评论杂志记者有机会在GPT-4发布前后采访OpenAI 的相关人员来了解该大语言模型的一些情况,并在第一时间发表报道“GPT-4 is bigger and better than ChatGPT—but OpenAI won’t say why (GPT-4比Chat GPT更大更好,但OpenAI不说为什么)” 试图介绍神秘的 GPT-4一些情况。同行们对此也已期待已久,虽然觉得 GPT-4 现在是所有基础大模型评估的标准,GPT-4 已成为新的里程碑,OpenAI 将继续引领人工智能的发展方向,但也更加抱怨其开放性,这一次它的工作原理更加深入地被封存了起来,“在没有看到技术细节的情况下,很难判断这些结果到底有多令人印象深刻”,有朋友甚至调侃,OpenAI 应该改为 ClosedAI ... 我们特将该内容编译出来和各位客户、合作伙伴朋友分享。如需转载,请联系我们(ID:15937102830)】】
OpenAI 终于发布了下一代大型语言模型GPT-4。它的上一个惊喜是ChatGPT,它总是很难被效仿,但这家总部位于旧金山的公司已经让GPT-4变得更大更好。
但OpenAI不愿透露它的规模有多大,以及为什么会更好。GPT-4是该公司有史以来发布的最神秘的版本,标志着其从非营利研究实验室向营利性科技公司的全面转型。
OpenAI的首席科学家 Ilya Sutskever 在GPT-4团队宣布消息一小时后的视频通话中对我说:“你知道,这是我们目前无法评论的事情。”“外面的竞争相当激烈。”
加入等候名单的用户和付费ChatGPT Plus的付费用户都可以使用GPT-4,但只能使用有限的文本功能。
GPT-4是一个多模态大型语言模型,这意味着它可以同时响应文本和图像。给它一张你冰箱里食物的照片,问它你能做什么,GPT-4就会尝试用照片上的食材做出食谱。
艾伦人工智能研究所(Allen Institute for AI)的Oren Etzioni 表示:“在许多方面的持续改进是显著的。”“GPT-4现在是所有基础模型评估的标准。”
开源大型语言模型BLOOM背后的人工智能初创公司hugging Face联合创始人 Thomas Wolf 说:“在过去几年里,一个好的多模态模型一直是许多大型科技实验室的圣杯。”“但它仍然难以捉摸。”
从理论上讲,将文本和图像结合起来可以让多模式模型更好地理解世界。“它也许能够解决语言模型的传统弱点,比如空间推理,”Wolf 说。
目前还不清楚GPT-4是否也是如此。OpenAI的新模型在一些基本推理方面似乎比ChatGPT更出色,可以解决一些简单的难题,比如用相同字母开头的单词总结文本块。在我的演示中,我看到GPT-4总结了OpenAI网站上的公告,使用了以g开头的单词:“GPT-4,突破性的代际增长,获得了更大的成绩。护栏,指引和收获。巨大的,开创性的,具有全球性的天赋。”在另一个演示中,GPT-4接受了一份关于税收的文件,并回答了相关的问题,并给出了其回答的理由。
在人类考试中,它的表现也优于ChatGPT,包括统一律师考试(其中GPT-4排名第90百分位,ChatGPT排名第10百分位)和生物奥林匹克竞赛(其中,GPT–4排名99百分位和ChatGPT排名31百分位)。“令人兴奋的是,现在开始在人类为自己使用的相同基准上进行评估,”Wolf 说。但他补充说,“在没有看到技术细节的情况下,很难判断这些结果到底有多令人印象深刻。”
根据OpenAI的说法,GPT-4比基于该公司之前技术GPT-3版本的ChatGPT表现更好,因为它是一个更大的模型,具有更多的参数(神经网络中的值在训练过程中被调整)。这遵循了该公司在之前的模型中发现的一个重要趋势。GPT-3的表现优于GPT-2,因为它比GPT-2的15亿个参数大了100多倍,有1750亿个参数。GPT-4的开发者之一Jakub Pachocki说:"多年来,这个基本公式并没有真正改变多少。"“但这仍然像建造一艘宇宙飞船,你需要把所有这些小部件都弄好,并确保没有一个坏掉。”
但是OpenAI选择不透露GPT-4的规模。与之前发布的版本不同,该公司没有透露任何关于GPT-4是如何建造的——没有数据,没有计算能力,也没有训练技术。“OpenAI现在是一家完全封闭的公司,其科学交流类似于产品新闻稿,”Wolf说。
OpenAI说,他们花了六个月的时间使GPT-4更加安全和准确。根据该公司的说法,GPT-4对OpenAI不允许的内容请求的响应率比GPT-3.5低82%,编造内容的可能性低60%。
OpenAI表示,它使用了与ChatGPT相同的方法,通过人类反馈使用强化学习。这涉及到要求人类评分员从模型中获得不同的回答,并使用这些分数来改进未来的输出。
该团队甚至使用GPT-4来改进自己,要求它生成导致偏见、不准确或冒犯性反应的输入,然后修复模型,使其在未来拒绝这样的输入。
GPT-4可能是迄今为止构建的最好的多模态大型语言模型。但它并不像GPT-3在2020年首次出现时那样独树一帜。过去三年发生了很多事。如今,GPT-4与其他多模式模型并列,包括DeepMind的Hugging Face 模型。Wolf说,Hugging Face正在开发一个开源的多模式模型,其他人可以免费使用和调整。
面对这样的竞争,OpenAI更多的是把这个版本当作一次产品发布会,而不是一次研究更新。GPT-4的早期版本已经与OpenAI的一些合作伙伴共享,包括微软,微软今天证实,它使用了GPT-4版本来构建Bing Chat。OpenAI目前还在与Stripe、Duolingo、Morgan Stanley和冰岛政府(使用GPT-4帮助保存冰岛语)等机构合作。
“启动这种规模的模型的成本对于大多数公司来说是难以承受的,但是OpenAI所采取的方法使得大型语言模型对初创公司来说非常容易,”投资公司Tola Capital的联合创始人 Sheila Gulati 说。“这将在GPT-4的基础上催生巨大的创新。”
然而,大型语言模型仍然存在根本性缺陷。GPT-4仍然可以生成有偏见的、虚假的和令人厌恶的文本;它也仍然可以被黑客入侵以绕过它的护栏。尽管OpenAI改进了这项技术,但它并没有完全修复它。该公司声称,其安全测试已经足够的GPT-4用于第三方应用程序。但它也准备好了迎接意外。
“安全不是一个二元的东西;它是一个过程,”Sutskever说。“当你达到一个新的能力水平时,事情就会变得复杂。其中很多功能现在都已经被很好地理解了,但我相信其中的一些仍然会让人感到惊讶。”
甚至 Sutskever 也表示,放慢发布速度有时可能是更好的选择:“在这样一个世界里,公司会想出某种程序,允许那些具有完全前所未有的能力的模型缓慢发布,这将是非常可取的”。
权益福利:
1、AI 行业、生态和政策等前沿资讯解析;
2、最新 AI 技术包括大模型的技术前沿、工程实践和应用落地交流(社群邀请人数已达上限,可先加小编微信:15937102830)
源于硅谷、扎根中国,上海殷泊信息科技有限公司(MoPaaS)是中国领先的人工智能(AI)平台和服务提供商,为用户的数字转型、智能升级和融合创新直接赋能。针对中国AI应用和工程市场的需求,基于自主的智能 PaaS 云平台专利技术,MoPaaS 在业界率先推出开放的AI平台为加速客户AI应用项目落地提供高效的GPU算力优化和模型开发运维 (ModelOps) 能力和服务。MoPaaS AI平台已经服务在教学科研、工业制造、能源交通、互联网、医疗卫生、政府和金融等行业超过300家国内外满意的客户的AI技术研发、人才培养和应用落地工程需求。MoPaaS 致力打造全方位开放的AI技术和应用生态圈。MoPaaS 被Forrester评为中国企业级云平台市场的卓越表现者(Strong Performer)。
END
▼ 往期精选 ▼
1、图灵奖获得者 Yoshua Bengio 认为 ChatGPT 是一个“警钟”
2、口述历史,探析ChatGPT的创造历程,ChatGPT的内部故事
4、基辛格: ChatGPT 预示着一场智能革命,而人类还没有准备好
▼点击下方“阅读原文”,查看文章来源!
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢