本文作者详细介绍了最近火爆CV圈三项关于MLP的工作。

本文目录

1 MLP-Mixer: An all-MLP Architecture for Vision
(来自Google Research, Brain Team,ViT作者团队)
1.1 MLP-Mixer原理分析
1.1.1 仅仅靠着MLP就真的无法解决复杂数据集的分类任务吗?
1.1.2 MLP-Mixer是如何处理输入图片的?
1.1.3 MLP-Mixer与之前Conv1×1的不同之处在哪里?
1.1.4 MLP-Mixer架构
1.1.5 MLP-Mixer实验
1.2 MLP-Mixer代码解读

2 RepMLP:卷积重参数化为全连接层进行图像识别
(来自清华大学,旷视,RepVGG作者团队)
2.1 RepMLP原理分析
2.1.1 深度学习模型的几个性质
2.1.2 RepMLP模块
2.1.3 如何将卷积等效成FC层?

3 ResMLP:ImageNet数据集训练残差MLP网络
(来自Facebook AI,索邦大学)
3.1 ResMLP原理分析
3.2 ResMLP代码解读

作者主页:https://www.zhihu.com/people/wang-jia-hao-53-3
感兴趣的可以继续戳原文。

内容中包含的图片若涉及版权问题,请及时与我们联系删除