论文链接:https://arxiv.org/pdf/2206.02353.pdf

近年来,自监督表示学习(Self-Supervised Representation Learning, SSRL)在计算机视觉、语音、自然语言处理(natural language processing, NLP)等领域受到广泛关注,近年来,它也逐渐被应用于传感器数据的时间序列等模态。传统模型通常需要大量注释良好的数据进行训练,这一事实推动了自我监督学习的流行。获取带注释的数据可能是一个困难且代价高昂的过程。自监督方法通过使用从原始数据中自由获取的监督信号对模型进行区分性预训练来提高训练数据的效率。现有的研究主要集中在单模态CV或NLP领域的方法,与此不同,本文的目的是首次全面综述多模态时序数据自监督学习方法。为此,我们 1) 对现有的SSRL方法进行了全面的分类; 2) 通过定义SSRL框架的关键组件引入了一个通用流水线; 3) 就其目标功能、网络架构和潜在应用对现有模型进行了比较; 4) 对每种类别和各种模态下的现有多模态技术进行了综述。最后,我们提出了现有的弱点和未来的机会。我们相信,我们的工作为利用多模态和/或时间数据的领域的SSRL需求提供了一个视角。

内容中包含的图片若涉及版权问题,请及时与我们联系删除