Unsupervised Feature Based Algorithms for Time Series Extrinsic Regression

解决问题:本篇论文旨在解决时间序列外在回归问题,即通过一组训练时间序列来形成一个连续响应变量的预测模型,该响应变量与回归器序列没有直接关系。同时,论文还试图比较不同算法在这个问题上的表现,包括之前的基准算法和最新的TSER模型。

关键思路:论文提出了两种新的TSER算法,FreshPRINCE和DrCIF,它们都是基于时间序列分类中的相关工作发展而来的。FreshPRINCE是一个流水线估计器,由一个转换成各种摘要特征的步骤,后跟一个旋转森林回归器。DrCIF是一个树集合,它从随机区间的摘要统计量中创建特征。实验结果表明,这两种算法与InceptionTime相比,在这个问题上表现显著更好。

其他亮点:本文介绍了一个用于比较算法的TSER存档,并将其扩展到63个问题。实验中使用了多个数据集,并且作者已经开源了他们的代码,这使得更多的研究人员可以使用这些算法。值得深入研究的是,FreshPRINCE和DrCIF是目前唯一明显优于标准旋转森林回归器的模型。

关于作者:本文的主要作者是David Guijo-Rubio、Matthew Middlehurst、Guilherme Arcencio、Diego Furtado Silva和Anthony Bagnall。他们分别来自西班牙的普拉多大学、英国的肯特大学和巴西的圣保罗大学。Bagnall教授是时间序列数据挖掘领域的知名专家,他曾发表过多篇关于时间序列分类和聚类的论文,如“Time-series Classification with COTE: The Collective of Transformation-Based Ensembles”和“Time-series clustering with shapelet-based features”。

相关研究:与本文相关的其他研究包括:“A Survey on Time Series Classification”(F. Bagnall等人,2017)、“Time Series Classification Using Multi-Channels Deep Convolutional Neural Networks”(H. Zhang等人,2018)和“Deep Learning for Time Series Classification: A Review”(J. Lines等人,2021)。

论文摘要:我们的研究探讨了针对时间序列外在回归问题的无监督特征算法。时间序列外在回归(TSER)是指利用一组训练时间序列来形成一个预测模型,该模型可以预测一个与回归系列无直接关系的连续响应变量。 TSER算法库于2022年发布,其中包括19个问题。我们将该库的问题数量增加到63个,并重现了基准算法的先前比较。然后,我们扩展了比较范围,包括更广泛的标准回归器和先前研究中使用的最新版本的TSER模型。我们表明,以前评估的回归器都不能胜过标准分类器旋转森林的回归适应性。我们介绍了两种新的TSER算法,这些算法是从时间序列分类相关工作中开发而来的。FreshPRINCE是一个管道估计器,包括将时间序列转换为各种摘要特征,然后是旋转森林回归器。 DrCIF是一种树集合,它从随机间隔的摘要统计数据中创建特征。我们的研究表明,与其他18个回归器相比,这两种算法以及InceptionTime表现出显着更好的性能。更重要的是,这两种提议(DrCIF和FreshPRINCE)模型是唯一明显优于标准旋转森林回归器的模型。

内容中包含的图片若涉及版权问题,请及时与我们联系删除