Flamingo：DeepMind的800亿参数少样本视觉语言模型

DeepMind 最新公布的论文推出了 Flamingo（火烈鸟）模型，这是一个单一的视觉语言模型（visual language model，VLM），它在广泛的开放式多模态任务中建立了少样本学习新 SOTA。这意味着 Flamingo 只需少量的特定例子（少样本）就能解决许多难题，而无需额外训练。Flamingo 的简单界面使这成为可能，它将图像、视频和文本作为提示（prompt），然后输出相关语言。