The impact of data set similarity and diversity on transfer learning success in time series forecasting

简介

模型在类似或不同的源数据集上预训练，通过利用迁移学习，已成为提高时间序列预测目标数据集的效率和准确性的关键。尽管基准测试验证了模型在各种目标数据集上的泛化性能，但没有结构化的研究提供相似性和多样性度量，解释源数据和目标数据的哪些特征导致了迁移学习的成功。我们的研究首次系统评估了源-目标相似性和源多样性对零-shot和微调预测结果的影响，包括准确性、偏差和不确定性估计。我们使用在五个公共源数据集上应用于预测五个目标数据集（包括真实的批发数据）的预训练神经网络进行了这些动态的研究。我们确定了两个基于特征的相似性和多样性度量，表明：源-目标相似性提高了预测准确性并减少了偏差，而源多样性提高了预测准确性和不确定性估计，并增加了偏差。
图表
解决问题

论文旨在系统评估源数据集与目标数据集的相似性和多样性对于零样本和微调时间序列预测精度、偏差和不确定性的影响。
关键思路

通过使用预训练的神经网络，论文发现源数据集与目标数据集的相似性可以提高预测精度和减少偏差，而源数据集的多样性可以提高预测精度和不确定性估计，但会增加偏差。
其它亮点

论文使用了五个公共数据集和五个目标数据集，包括真实的批发数据。研究发现，源数据集与目标数据集的相似性和多样性对于时间序列预测的成功至关重要。此外，论文提出了两个基于特征的相似性和多样性度量，可以帮助评估模型的泛化能力。
相关研究

近期的相关研究包括：'Time Series Forecasting with Deep Learning: A Survey'、'Transfer Learning for Time Series Forecasting'、'Deep Learning for Time Series Forecasting: A Survey'等。

The impact of data set similarity and diversity on transfer learning success in time series forecasting

评论