TimeAutoDiff: Combining Autoencoder and Diffusion model for time series tabular data synthesizing

2024年06月23日
  • 简介
    本文利用潜在扩散模型的力量生成合成时间序列表格数据。除了时间和特征的相关性外,表格中特征的异质性一直是时间序列表格数据建模的主要障碍之一。我们通过结合变分自动编码器(VAE)和去噪扩散概率模型(DDPM)的思想来解决这个问题。我们的模型名为\texttt{TimeAutoDiff},具有以下几个关键优势:(1)通用性:能够处理从单个到多序列数据集的广泛时间序列表格数据;(2)良好的保真度和实用性保证:对六个公开可用数据集进行的数值实验表明,在生成时间序列表格数据方面,与现有模型相比,我们的模型在四个度量保真度和实用性方面均取得了显著的改进;(3)快速采样速度:与现有基于扩散的模型实现的顺序数据采样方案相比,我们的模型可以生成整个时间序列数据,最终导致采样速度的显着提高;(4)实体条件生成:这是文献中第一次实现异质特征的多序列时间序列表格数据的条件生成,可以在多个科学和工程领域进行情景探索。代码正在准备发布,但可以根据要求提供。
  • 图表
  • 解决问题
    本文旨在利用潜在扩散模型的能力,生成合成时间序列表格数据。同时解决了特征异构性在时间序列表格数据建模中的问题。
  • 关键思路
    本文将变分自编码器(VAE)和去噪扩散概率模型(DDPM)的思想相结合,提出了一种名为 TimeAutoDiff 的模型。该模型具有广泛性、良好的保真度和实用性保证、快速采样速度、实体条件生成等优点。
  • 其它亮点
    本文在六个公开数据集上进行了数值实验,证明了 TimeAutoDiff 在生成时间序列表格数据方面相比于现有模型具有显著的改进,包括保真度和实用性等四个度量指标。此外,该模型的代码即将发布,可以在请求时获得。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,如《A Deep Generative Model for Multi-Rate Multivariate Time Series》、《Learning Deep Latent Gaussian Models with Markov Chain Monte Carlo》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论