在机器学习中,我们最常遇到的一个难题就是:缺少优质的标注数据。
自监督学习让我们能够没有大规模标注数据也能获得优质的表征,它利用数据自身的关系来做为标注样本进行训练并且优化预定义的 pretext 任务。
来也科技作为一家优秀的 RPA + AI 企业,对各种机器学习方式都进行了探索及实践。本文选自公司内部的 CV 分享。
目录:
一.什么是自监督学习
二.计算机视觉中的常用自监督任务
- 预测图像旋转方向
- 预测图片补丁位置相对关系
- 补丁拼图
- 图片上色
- 自编码器系列
- 对抗神经网络
- 对比学习
三.对比学习核心问题
- 样本Pair对如何构造
- Loss 如何设计
- Contrast Loss
- Triplet Loss
- N-Pair Loss
- InfoNCE Loss
四.典型的图像自监督对比学习方式
1. 正负Pair自监督对比学习
a. SimCLR
b. MOCO系列
2. 聚类自监督对比学习
a. SmAV
3. 非对称结构的自监督学习
a. SimSiam
4. 对比学习模型总结
五.自监督学习在Laiye OCR上的尝试
1. SimSiam实现
2. SimCLR 实现
3. 实现细节
a. 自监督+finetune训练过程
b. 监督训练过程
c. 结果评测
六.参考资料
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢