Deep Temporal Deaggregation: Large-Scale Spatio-Temporal Generative Models

2024年06月18日
  • 简介
    许多今天的数据都是来自各种来源的时间序列数据,例如传感器、交易系统或生产系统。这些数据的主要挑战包括隐私和商业敏感性。生成式时间序列模型有潜力克服这些问题,允许代表性合成数据(例如城市中人们的移动)公开共享,并为整个社会带来益处。然而,现代方法仅限于序列长度过短和规模小得难以承受。除了主要的内存限制外,模型生成的样本越长,准确性和代表性就越低。这个问题被缺乏全面和可访问的基准进一步恶化。此外,实际应用中的一个常见需求是针对数据分布变化的假设分析和动态适应,以便用于决策和管理一个不断变化的世界:如果这条路暂时被封锁或另一条路被添加了怎么办?本文的重点是移动性数据,如城市中人们的移动,需要解决所有这些问题。为此,我们提出了一种基于Transformer的扩散模型TDDPM,用于时间序列,其性能优于现有技术,并且比其更具规模优势。这在一个新的全面基准测试中得到了评估,包括多个序列长度、标准数据集和评估指标。我们还展示了如何将模型置于空间占用频率信息的先验条件下,从而使模型能够为以前未见过的环境和道路网络及其使用情况发生变化的假设情况生成移动性数据。这是通过从城市的一部分训练移动性数据来评估的。然后,仅使用聚合空间信息作为先验条件,我们展示了对城市未观察到的其余部分的超出分布的泛化。
  • 图表
  • 解决问题
    本文旨在解决时间序列数据隐私和商业敏感性问题,提出一种基于Transformer的扩散模型TDDPM,用于生成代表性合成数据,如城市中的人员移动数据,并提供一个全面的基准测试。
  • 关键思路
    文章提出的TDDPM模型使用Transformer和扩散过程相结合的方法,能够更好地生成长序列的时间序列数据,并且能够适应数据分布的动态变化。
  • 其它亮点
    本文提出的TDDPM模型在多个序列长度、标准数据集和评估指标上进行了全面的基准测试,并取得了比现有方法更好的性能和更好的可扩展性。此外,模型还可以在先验空间占用频率信息的条件下进行训练,以生成未见过的环境和假设场景的移动数据。
  • 相关研究
    最近的相关研究包括:1. VAE-GAN模型用于生成时间序列数据,2. 基于RNN的模型用于生成时间序列数据,3. 基于GAN的模型用于生成时间序列数据。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论