QClusformer: A Quantum Transformer-based Framework for Unsupervised Visual Clustering

2024年05月30日
  • 简介
    无监督视觉聚类是计算机视觉中的基石,已经研究了几十年,为众多视觉任务带来了重大成果。然而,当面对大量未标记数据时,这些算法涉及相当大的计算要求。相反,量子计算在处理大规模数据库时加速无监督算法方面具有潜力。在这项研究中,我们介绍了 QClusformer,这是一种开创性的基于 Transformer 的框架,利用量子机器来解决无监督视觉聚类挑战。具体来说,我们从量子的角度设计了 Transformer 架构,包括自注意模块和 Transformer 块,以便在量子硬件上执行。此外,我们提出了 QClusformer,这是一种基于 Transformer 架构的变种,专门针对无监督视觉聚类任务。通过将这些元素集成到端到端框架中,QClusformer 在经典计算机上运行的先前方法中始终表现优异。在包括 MS-Celeb-1M 和 DeepFashion 在内的各种基准测试中,实证评估强调了 QClusformer 相对于最先进的方法的优越性能。
  • 图表
  • 解决问题
    本文旨在解决大规模无标签数据集下无监督视觉聚类算法的计算需求大的问题,同时探索利用量子计算加速无监督算法的可能性。
  • 关键思路
    本文提出了一种基于Transformer架构和量子计算的无监督视觉聚类框架QClusformer,并通过实验验证了其在多个数据集上的优越性能。
  • 其它亮点
    本文的亮点包括:1. 提出了一种基于Transformer架构和量子计算的无监督视觉聚类框架QClusformer;2. 通过实验验证了QClusformer在MS-Celeb-1M和DeepFashion数据集上的优越性能;3. 论文提出的思路对于利用量子计算加速无监督算法具有一定的启示意义。
  • 相关研究
    最近在这个领域中,一些相关的研究包括:1. DeepCluster:A General Clustering Framework Based on Convolutional Autoencoder(Caron等,2018);2. Unsupervised Deep Embedding for Clustering Analysis(Junyuan等,2016);3. Unsupervised Learning of Visual Representations by Solving Jigsaw Puzzles(Noroozi等,2016)。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论