标题:UIUC、微软、UNC、哥大|Language Models with Image Descriptors are Strong Few-Shot Video-Language Learners(具有图像描述符的语言模型很强少样本视频语言学习器)
https://github.com/MikeWangWZHL/VidIL
https://arxiv.org/pdf/2205.10747v2.pdf
内容中包含的图片若涉及版权问题,请及时与我们联系删除
https://github.com/MikeWangWZHL/VidIL
https://arxiv.org/pdf/2205.10747v2.pdf
内容中包含的图片若涉及版权问题,请及时与我们联系删除
沙发等你来抢
评论
沙发等你来抢