在机器学习中,我们最常遇到的一个难题就是:缺少优质的标注数据。

自监督学习让我们能够没有大规模标注数据也能获得优质的表征,它利用数据自身的关系来做为标注样本进行训练并且优化预定义的 pretext 任务。

来也科技作为一家优秀的 RPA + AI 企业,对各种机器学习方式都进行了探索及实践。本文选自公司内部的 CV 分享。

目录:

一.什么是自监督学习

二.计算机视觉中的常用自监督任务

  1. 预测图像旋转方向
  2. 预测图片补丁位置相对关系
  3. 补丁拼图
  4. 图片上色
  5. 自编码器系列
  6. 对抗神经网络
  7. 对比学习

三.对比学习核心问题

  1. 样本Pair对如何构造
  2. Loss 如何设计
  1. Contrast Loss
  2. Triplet Loss
  3. N-Pair Loss
  4. InfoNCE Loss

四.典型的图像自监督对比学习方式

1. 正负Pair自监督对比学习

a. SimCLR

b. MOCO系列

2. 聚类自监督对比学习

a. SmAV

3. 非对称结构的自监督学习

a. SimSiam

4. 对比学习模型总结

五.自监督学习在Laiye OCR上的尝试

1. SimSiam实现

2. SimCLR 实现

3. 实现细节

a. 自监督+finetune训练过程

b. 监督训练过程

c. 结果评测

六.参考资料

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除