- 简介深度聚类凭借神经网络强大的特征提取能力,在分析高维和复杂的真实世界数据方面取得了巨大成功。深度聚类方法的性能受到各种因素的影响,例如网络结构和学习目标。然而,正如本调查所指出的,深度聚类的本质在于先前知识的融合和利用,这在现有的工作中被大量忽视。从基于数据结构假设的开创性深度聚类方法到基于数据增强不变性的最新对比聚类方法,深度聚类的发展本质上对应着先前知识的演变。在本次调查中,我们通过将其分为六类先前知识,全面回顾了深度聚类方法。我们发现,总体而言,先前的创新遵循两种趋势,即i)从挖掘到构建,和ii)从内部到外部。此外,我们在五个广泛使用的数据集上提供了基准,并分析了具有不同先前知识的方法的性能。通过提供一种新的先前知识视角,我们希望本调查能够提供一些新的见解,并激发深度聚类社区的未来研究。
- 图表
- 解决问题本文旨在探讨深度聚类方法的先验知识,并提出六种分类方式。同时,通过对五种数据集的实验分析,比较不同先验知识下方法的性能。
- 关键思路本文的关键思路是将先验知识纳入深度聚类方法中,提出了六种分类方式,包括基于数据结构假设的深度聚类方法和基于数据增强不变性的对比聚类方法。
- 其它亮点本文提供了一个基于先验知识的深度聚类方法分类方式,通过对五种数据集的实验比较不同先验知识下方法的性能,为深度聚类领域的研究提供了一些新思路。此外,本文还提供了一个基准测试和分析,以及开源了代码。
- 最近的相关研究包括《Unsupervised Deep Embedding for Clustering Analysis》、《Deep Clustering via Joint Convolutional Autoencoder Embedding and Relative Entropy Minimization》等。
沙发等你来抢
去评论
评论
沙发等你来抢