研究可以推广、扩展和加速科学的人工智能模型

下周是第11届国际学习代表会议(ICLR)的开始,该会议将于5月1日至5日在卢旺达基加利举行。这将是非洲举办的第一次大型人工智能(AI)会议,也是自疫情爆发以来的第一次面对面活动。

https://www.deepmind.com/blog/deepminds-latest-research-at-iclr-2023 

来自世界各地的研究人员将聚集在一起,分享他们在深度学习方面的前沿工作,涵盖人工智能、统计和数据科学领域,以及包括机器视觉、游戏和机器人在内的应用。作为钻石赞助商和DEI冠军,我们很自豪地支持这次会议。

来自DeepMind的团队今年将提交23篇论文。以下是一些亮点:

关于AGI之路的开放式问题

最近的进展表明,人工智能在文本和图像方面的性能令人难以置信,但需要更多的研究来使系统跨领域和规模进行推广。这将是发展通用人工智能(AGI)作为我们日常生活中变革工具道路上的关键一步。

我们提出了一种新的方法,模型通过一次性解决两个问题来学习。通过训练模型同时从两个角度看待问题,他们学习如何对需要解决类似问题的任务进行推理,这有利于泛化。我们还探索了神经网络通过将其与Chomsky语言层次结构进行比较来推广的能力。通过在16个不同的任务中严格测试2200个模型,我们发现某些模型很难推广,并发现使用外部内存增强它们对提高性能至关重要。

我们应对的另一个挑战是如何在专家层面的长期任务上取得进展,因为奖励很少。我们开发了一种新的方法和开源培训数据集,以帮助模型学会在很长一段时间内以类似人类的方式进行探索。

创新方法

随着我们开发更先进的人工智能能力,我们必须确保当前方法在现实世界中按预期高效工作。例如,尽管语言模型可以产生令人印象深刻的答案,但许多人无法解释他们的回答。我们引入了一种使用语言模型的方法,通过利用其底层逻辑结构来解决多步推理问题,提供人类可以理解和检查的解释。另一方面,对抗性攻击是通过推动人工智能模型产生错误或有害的输出来探索人工智能模型极限的一种方式。关于对抗示例的培训使模型对攻击更加强大,但可能以“常规”输入的性能为代价。我们表明,通过添加适配器,我们可以创建模型,使我们能够实时控制这种权衡。

强化学习(RL)已被证明在一系列现实世界的挑战中是成功的,但RL算法通常旨在很好地完成一项任务,并努力推广到新的任务。我们提出算法蒸馏,这种方法通过训练变压器模仿不同任务中RL算法的学习历史,使单个模型能够有效地推广到新任务。RL模型还通过试错学习,这可能非常耗时且非常耗时。我们的模型Agent 57花了近800亿帧的数据,才能在57个雅达利游戏中达到人类水平的性能。我们分享了一种使用200倍更少的经验来训练到这个水平的新方法,大大降低了计算和能源成本。

科学人工智能

人工智能是研究人员分析大量复杂数据并了解我们周围世界的强大工具。几篇论文展示了人工智能如何加速科学进步,以及科学如何推动人工智能进步。

从3D结构中预测分子的性质对药物发现至关重要。我们提出了一种去噪方法,该方法实现了分子性质预测的最新水平,允许大规模的预训练,并在不同的生物数据集之间进行推广。我们还引入了一种新的变压器,它仅使用原子位置的数据就可以进行更准确的量子化学计算。

最后,通过FIGnet,我们从物理学中汲取灵感,模拟茶壶或甜甜圈等复杂形状之间的碰撞。这个模拟器可以应用于机器人、图形和机械设计。

内容中包含的图片若涉及版权问题,请及时与我们联系删除