不久前,OpenAI 研究主管 Jeff Clune团队在博客上介绍了视频预训练模型VPT:

我们通过视频预训练(VPT)在大量未标记的人类地雷游戏视频数据集上训练神经网络来玩地雷游戏,同时只使用少量标记的承包商数据。通过微调,我们的模型可以学习制作钻石工具,这项任务通常需要熟练的人20分钟以上(24000个动作)。我们的模型使用按键和鼠标移动的本机人机界面,使其非常通用,并代表着向使用代理的通用计算机迈进了一步。

We trained a neural network to play Minecraft by Video PreTraining (VPT) on a massive unlabeled video dataset of human Minecraft play, while using only a small amount of labeled contractor data. With fine-tuning, our model can learn to craft diamond tools, a task that usually takes proficient humans over 20 minutes (24,000 actions). Our model uses the native human interface of keypresses and mouse movements, making it quite general, and represents a step towards general computer-using agents.

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除