跨模式推理对人工智能至关重要。越来越需要对模式之间的交互进行建模(例如,视觉,语言),以改进对现有任务的AI预测并启用新的应用程序。多模式AI问题包括视觉问答,和视觉对话到具体化的AI,虚拟助手以及在社交媒体上检测不良内容。更好的工具(对于研究人员提出新颖的想法以及对从业人员生产用例而言)都有可能加速多模式AI的发展。MMF是基于PyTorch构建的模块化框架。MMF随附了最新的视觉和语言预训练模型,大量现成的标准数据集,通用层和模型组件以及训练+推理实用程序。MMF还被多个Facebook产品团队用于多模式理解用例,因为它有助于快速将研究推向生产。

内容中包含的图片若涉及版权问题,请及时与我们联系删除