近日,GitHub上开源一个多模态相关的仓库。该仓库是一个面向VQA和图像描述研究的多模态数据集和视觉特征库,可直接用pip安装。

项目地址:https://github.com/cdancette/multimodal

内容中包含的图片若涉及版权问题,请及时与我们联系删除