论文链接:https://arxiv.org/pdf/2206.02664.pdf

胶囊网络作为卷积神经网络(Convolutional Neural networks, CNNs)的另一种学习以对象为中心表示的方法,可以提高泛化能力和样本复杂度。与cnn不同,胶囊网络使用神经元组对视觉实体进行编码,显式地建模部分-整体层次关系,并学习这些实体之间的关系。胶囊网络早期取得的有前景的成果激励了深度学习社区继续努力提高其在多个应用领域的性能和可扩展性。然而,胶囊网络研究的一个主要障碍是缺乏可靠的参考点来理解它们的基本思想和动机。这项综述的目的是提供一个全面的概述胶囊网络的研究景观,这将为社区的未来提供宝贵的资源。为此,我们首先介绍胶囊网络背后的基本概念和动机,例如计算机视觉中的等变推理。然后,我们将介绍胶囊路由机制的技术进展和胶囊网络的各种公式,如生成和几何。此外,我们还详细解释了胶囊网络与Transformers中流行的注意力机制之间的关系,并强调了它们在表征学习背景下的非微不足道的概念相似性。随后,我们探索了胶囊网络在视频和运动(如视频对象分割、回归跟踪和动作视频识别)、自然语言处理(如文本分类、关系提取、语言和视觉、推荐系统)、医学成像(如病变的语义分割、脑肿瘤分类)、故障诊断(如轴承故障诊断)、高光谱成像和伪造检测等方面的广泛应用。最后,我们对胶囊网络研究的主要障碍进行了深入的讨论,并指出了未来的研究方向。

内容中包含的图片若涉及版权问题,请及时与我们联系删除