本文介绍了Nanyi Fei, Zhiwu Lu等人发表在nature communications期刊上的文章《Towards artificial general intelligence via a multimodal foundation model》。
论文链接:https://doi.org/10.1038/s41467-022-30761-2
人工智能(AI)的根本目的是模仿人类的核心认知活动。尽管在人工智能研究中已经取得了巨大的成功,但现有的方法大多只具有单一的认知能力。为了克服这一限制,并向通用人工智能(AGI)迈出坚实的一步,作者开发了一个预先训练了大量多模态数据的基础模型,该模型可以快速适应各种下游认知任务。为了实现这一目标,作者提出利用从互联网上抓取的弱语义相关性数据,通过自监督学习来预先训练他们的基础模型,并表明可以在广泛的下游任务上获得有希望的结果。特别地,作者利用已开发的模型可解释性工具,证明了他们的基础模型具有很强的想象能力。作者相信他们的工作向AGI迈出了变革性的一步,从“弱或狭义人工智能”到“强或广义人工智能”。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢