Fast leave-one-cluster-out cross-validation by clustered Network Information Criteria (NICc)

简介

本文介绍了一种聚类估计器，用于近似留一聚类交叉验证偏差的网络信息准则（NICc），可用作建模聚类数据时基于聚类的交叉验证的替代方法。 Stone证明了如果参数模型正确，赤池信息准则（AIC）是留一观察交叉验证的渐近等价。Ripley指出，Stone证明中推导出的网络信息准则（NIC）是模型不正确时留一观察交叉验证的更好近似。对于聚类数据，我们使用Fisher信息矩阵的估计器替换NIC中的矩阵，从而得到了一种聚类估计器NICc，该估计器考虑了聚类效应。与建模非聚类数据时的NIC相比，NICc对于建模聚类数据时的惩罚更大，因此可以更有效地防止过度拟合。在模拟研究和实证例子中，我们使用线性回归和逻辑回归分别对具有高斯或二项式响应的聚类数据进行建模。我们证明了NICc是留一聚类交叉验证偏差的更好近似，并且比AIC和贝叶斯信息准则（BIC）更有效地防止过度拟合。相对于AIC和BIC，NICc导致更准确的模型选择，这是通过基于聚类的交叉验证确定的。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

本论文旨在提出一种聚类估计的网络信息准则（NICc），以近似于留一群集交叉验证偏差，从而可以用作建模聚类数据的交叉验证的替代方法。
关键思路

通过将NIC中的Fisher信息矩阵替换为其调整聚类的估计器，推导出了聚类估计器NICc。NICc在建模聚类数据时比未聚类的NIC更有效地防止过度拟合。
其它亮点

在模拟研究和实证案例中，使用线性和逻辑回归分别对带有高斯或二项式响应的聚类数据进行建模。结果表明，与AIC和BIC相比，NICc更好地近似于留一群集交叉验证偏差，并更有效地防止过度拟合。NICc在模型选择方面比AIC和BIC更准确。
相关研究

近期的相关研究包括“Clustered Cross-Validation for Time Series Data”和“Cluster-Robust Variance Estimation for Panel Models”。

Fast leave-one-cluster-out cross-validation by clustered Network Information Criteria (NICc)

提问交流

提问交流