- 简介有效利用时间序列数据通常受到数据数量的限制,尤其是在分布转移条件下,反映复杂动态的数据量往往很少。现有数据集可能无法涵盖进行强大和全面分析所需的所有统计属性。在金融和医疗保健等领域,隐私问题还可能进一步限制其可访问性。本文提出了一种方法,利用大型语言模型和数据源接口来探索和收集时间序列数据集。虽然这些数据是从外部来源获得的,但收集到的数据与主要时间序列数据集共享关键的统计属性,使得可以对各种情况进行建模和适应。当原始数据受限或缺乏必要属性时,这种方法可以扩大数据量。它表明,收集的数据集可以有效地补充现有数据集,特别是涉及数据分布变化的情况。我们通过实际示例展示了收集数据集的有效性,并展示了在这些数据集上微调的时间序列预测基础模型与没有微调的模型实现的可比性能。
- 图表
- 解决问题本论文旨在解决时间序列数据量稀缺、数据分布转移等问题,提出了一种利用大型语言模型和数据源接口探索和收集时间序列数据集的方法。
- 关键思路该方法通过收集具有关键统计属性的外部数据集,补充原有数据集的不足之处,从而扩大数据量,适应各种场景。论文通过实例展示了收集数据集的有效性,并表明在这些数据集上进行微调的时间序列预测模型可以获得与未进行微调的模型相当的性能。
- 其它亮点论文的亮点在于提出了一种利用大型语言模型和数据源接口收集时间序列数据集的方法,该方法可以有效地补充现有数据集的不足之处。实验结果表明,该方法可以提高时间序列预测模型的性能。论文还提供了开源代码和数据集。
- 在这个领域中,最近的相关研究包括《Time Series Data Augmentation with Generative Adversarial Networks》和《Time Series Forecasting with Deep Learning: A Survey》等。
沙发等你来抢
去评论
评论
沙发等你来抢