- 简介$2$-Wasserstein距离对分布之间的微小几何差异非常敏感,因此是一种非常强大的差异度量。然而,由于这种敏感性,小的异常值质量也可能导致两个相似分布之间的$2$-Wasserstein距离显著增加。同样,抽样偏差可能导致$\mathbb{R}^2$中$n$个样本的经验$2$-Wasserstein距离以$n^{-1/4}$的速率收敛到真实距离,这比$1$-Wasserstein距离的$n^{-1/2}$收敛速率慢得多。 我们引入了一族新的距离,称为$k$-RPW距离,其中$k\geq 0$是参数,它基于计算部分$2$-Wasserstein距离。我们证明了:(1)$k$-RPW满足度量性质,(2)$k$-RPW对小的异常值质量具有鲁棒性,同时保留了$2$-Wasserstein距离对微小几何差异的敏感性,(3)当$k$是常数时,$k$-RPW距离在$\mathbb{R}^2$中$n$个样本的经验分布之间的收敛速率为$n^{-1/3}$,比$2$-Wasserstein距离的$n^{-1/4}$收敛速率更快。 利用部分$p$-Wasserstein距离,我们将我们的距离扩展到任何$p\in [1,\infty]$。通过适当设置参数$k$或$p$,我们可以将我们的距离减小到总变异、$p$-Wasserstein和L\'evy-Prokhorov距离。实验表明,与$1$-Wasserstein距离、$2$-Wasserstein距离和TV距离相比,我们的距离函数在嘈杂的实际数据集上的图像检索任务中实现了更高的准确性。
- 图表
- 解决问题论文旨在介绍一种新的距离度量方法,称为k-RPW距离,以解决2-Wasserstein距离对于小异常值和采样偏差的敏感性问题。
- 关键思路k-RPW距离是基于计算部分2-Wasserstein距离的一种距离度量方法,通过参数k进行控制,可以将其降低为总变差距离、p-Wasserstein距离或Lévy-Prokhorov距离,同时保持对于几何差异的敏感性。
- 其它亮点论文证明了k-RPW距离满足度量性质,并且相比于2-Wasserstein距离,k-RPW距离对于小异常值更加稳健,同时在n个样本的情况下,k-RPW距离的收敛速度为n^{-1/3},优于2-Wasserstein距离的n^{-1/4}。实验结果表明,k-RPW距离在噪声实际数据集上的图像检索任务中比1-Wasserstein距离、2-Wasserstein距离和总变差距离具有更高的准确性。
- 相关研究包括Wasserstein距离及其变体的研究,如Sinkhorn算法、Adaptive Wasserstein等。
沙发等你来抢
去评论
评论
沙发等你来抢