HTAP Databases: A Survey

2024年04月24日
  • 简介
    自从Gartner提出了混合事务和分析处理(HTAP)的术语以来,已经提出了许多HTAP数据库,以便将事务和分析相结合,以实现各种数据密集型应用程序的实时数据分析。 HTAP数据库通常通过利用行存储和列存储来处理事务和分析查询的混合工作负载,从而在统一系统中处理这些工作负载。由于存在不同的存储架构和处理技术以满足各种不同应用程序的要求,因此总结这些关键技术的优缺点至关重要。本文提供了HTAP数据库的全面调查。我们主要根据四种存储架构对最先进的HTAP数据库进行分类:(a)主要行存储和内存列存储;(b)分布式行存储和列存储副本;(c)主要行存储和分布式内存列存储;以及(d)主要列存储和Delta行存储。然后,我们回顾了HTAP数据库中的关键技术,包括混合工作负载处理、数据组织、数据同步、查询优化和资源调度。我们还讨论了现有的HTAP基准。最后,我们提供了HTAP技术的研究挑战和机会。
  • 作者讲解
  • 图表
  • 解决问题
    综述了当前HTAP数据库的存储架构和处理技术,分析了现有HTAP基准测试的局限性和未来研究方向。
  • 关键思路
    综述了四种存储架构的HTAP数据库,包括混合工作负载处理、数据组织、数据同步、查询优化和资源调度等关键技术。
  • 其它亮点
    论文分类综述了当前HTAP数据库的四种存储架构,讨论了各自的优缺点;还分析了现有HTAP基准测试的局限性和未来研究方向,提出了值得关注的问题和挑战。
  • 相关研究
    相关研究包括《The End of an Architectural Era》、《A Survey of Large-Scale Data Management》等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问