【论文标题】Supporting Clustering with Contrastive LearningMachine Translation 【作者团队】Dejiao Zhang,Feng Nan,Xiaokai Wei,Shangwen Li,Henghui Zhu,Kathleen McKeown,Ramesh Nallapati,Andrew Arnold,Bing Xiang 【机构】哥伦比亚大学 【发表时间】NAACL 2021 【论文链接】hhttps://arxiv.org/pdf/2103.12953.pdf 【推荐理由】对SCCL如何有效地结合自顶向下聚类和自底向上实例对比学习来实现更好的簇间距离和簇内距离进行了深入分析和论证。提出了一种新颖的端到端无监督聚类框架,该框架在各种短文本聚类数据集上大幅度提高了最先进的结果。 无监督聚类的目的是根据在表示空间中测量的一定距离发现数据的语义类别。然而,在学习过程的开始阶段,不同的类别往往在表示空间中相互重叠,这对基于距离的聚类实现不同类别之间的良好分离提出了重大挑战。为此,我们建议使用对比学习(SCCL)支持聚类——一种利用对比学习促进更好分离的新框架。我们评估了SCCL在短文本聚类方面的性能,并表明SCCL在大多数基准数据集上显著提高了最先进的结果,精度提高了3%-11%,归一化互信息提高了4%-15%。此外,我们的定量分析表明,SCCL利用自底向上实例识别和自顶向下聚类的优势,在使用真实类标签评估时,实现了更好的类内和类间距离