- 简介时间序列数据已经被证明在各种研究领域中至关重要。大量时间序列数据的管理在深度学习任务中存在挑战,特别是在训练深度神经网络方面。最近,一种名为“数据集压缩”的技术已经出现作为解决这个问题的方案。这种技术生成一个较小的合成数据集,在分类等下游任务中具有与完整真实数据集相当的性能。然而,以前的方法主要设计用于图像和图形数据集,直接将它们应用于时间序列数据集会导致性能不佳,因为它们不能有效地利用时间序列数据中固有的丰富信息,特别是在频率域中。在本文中,我们提出了一个名为“Dataset Condensation for Time Series Classification via Dual Domain Matching (CondTSC)”的新框架,专注于时间序列分类数据集压缩任务。与以前的方法不同,我们提出的框架旨在生成一个符合时间和频率域中代理目标的压缩数据集。具体而言,CondTSC结合了多视角数据增强、双域训练和双代理目标,以增强时间和频率域中的数据集压缩过程。通过大量实验,我们证明了我们提出的框架的有效性,它优于其他基线,并学习到了一个符合原始数据分布的压缩合成数据集。
- 图表
- 解决问题本文旨在解决大规模时间序列数据管理的问题,提出了一种名为CondTSC的框架,用于时间序列分类数据集的压缩。
- 关键思路CondTSC框架通过多视角数据增强、双重域训练和双重代理目标等方法,提高了时间和频率域内数据集压缩的效果。
- 其它亮点实验结果表明,CondTSC框架优于其他基线模型,生成的合成数据集符合原始数据的分布。该论文的代码和数据集已经公开。
- 近期的相关研究包括时间序列数据集压缩和数据增强的方法,如DTC、TSCA和TDAE等。
沙发等你来抢
去评论
评论
沙发等你来抢