How to characterize imprecision in multi-view clustering?

2024年04月07日
  • 简介
    现有的方法只能在结合不同视角信息时将对象分配给特定的(单例)簇,因此仍然具有对不同簇之间重叠区域中对象不确定性的刻画不足的问题,这导致高错误风险。因此,本文想回答的问题是:如何刻画多视角聚类中的不确定性?相应地,我们提出了一种基于熵约束的多视角低秩证据c均值(MvLRECM)。所提出的MvLRECM可以被视为基于置信函数理论的证据c均值的多视角版本。在MvLRECM中,每个对象被允许以不同程度的支持度(置信度质量)属于不同的簇,以刻画决策时的不确定性。此外,如果一个对象在几个单例簇的重叠区域内,则可以将其分配给元簇,该元簇定义为这些单例簇的并集,以刻画结果的局部不确定性。此外,采用熵加权和低秩约束来减少不确定性并提高准确性。与现有方法相比,我们在几个玩具数据集和UCI真实数据集上证明了MvLRECM的有效性。
  • 图表
  • 解决问题
    如何在多视角数据聚类中表征不确定性和不精确性?
  • 关键思路
    提出了一种基于证据理论的多视角低秩证据c均值聚类算法(MvLRECM),允许对象以不同的支持度(信念质量)属于不同的簇,并将对象分配到元簇中以表征不同簇之间的重叠区域的不确定性和不精确性。同时,采用熵权重和低秩约束来减少不精确性和提高准确性。
  • 其它亮点
    实验结果表明,MvLRECM算法在多个toy和UCI真实数据集上的效果优于现有的方法。该论文的亮点包括采用了证据理论来表征不确定性和不精确性,提出了元簇概念来表征不同簇之间的重叠区域,采用熵权重和低秩约束来减少不精确性和提高准确性。
  • 相关研究
    最近的相关研究包括基于模糊聚类的多视角聚类方法,以及基于张量分解的多视角聚类方法。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论