标题:罗格斯大学|FAST-PCA: A Fast and Exact Algorithm for Distributed Principal Component Analysis(FAST-PCA:一种快速准确的算法分布式主成分分析)
作者:罗格斯大学电气与计算机工程与统计学Arpita Gang, Waheed U. Bajwa副教授
简介:本文提出一种分布式降维方法。主成分分析 (PCA) 是机器学习领域的基本数据预处理工具。虽然PCA常被称为降维,但PCA的目的其实有两个:降维和特征学习。此外,现代数据集中的维度和样本量巨大使得无法使用集中式 PCA 解决方案。在这方面,本文重新考虑了 PCA 的问题,当数据样本分布在任意连接的网络中的节点上。虽然分布式PCA的一些解决方案存在那些要么忽略了特征学习目的部分,要么有通信开销使他们低效和/或缺乏精确的收敛保证。为了解决上述问题,本文提出了一个分布式PCA算法称为FAST-PCA。所提出的算法在通信方面是有效的,可以证明线性地收敛到导致降维主成分以及不相关的特征。我们的主张得到了实验结果的进一步支持。
论文下载:https://arxiv.org/pdf/2108.12373v1.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢