随着云计算、大数据和人工智能等信息技术的快速发展,各行业数字化水平的逐步提高,企业业务环境和计算场景日益复杂,数间的关联关系也正在变得更加交错。
在面对需要深度挖掘数据间复杂关联关系的场景时,传统的关系型数据往往计算效率低下,难以满足应用需求。
在此背景下,图便有了大展身手的空间。这里的“图”( Graph )是针对图论而言,并非常见的图片/图形( Picture / Image ),而是指由一系列的点、边构成的图数据,能更自然、直观地表述数据间的关联关系,是一种更符合人类思考方式的抽象表达;图计算技术基于图数据开展分析和计算,从中挖掘出有价值的信息、知识和规律,为实际业务应用提供支持。
围绕中国图计算技术及应用话题, CB Insights 中国正式发布《2022中国图计算技术及应用发展研究报告》,通过科研端文献研究、产业调研与专家访谈等方式,从技术、人才、科研与产业四个维度展开分析,阐明行业发展背景、追溯技术发展历程、拆解技术原理及优势、勾勒行业格局,并研判图计算未来发展趋势。
图是对世界万物的一种自然表达
目前,图数据库和图计算系统(也称图计算引擎)是图计算技术领域的核心内容,前者主要负责图数据进行增删查改等操作,后者主要负责执行对图数据的深度分析处理。
图丨图数据库与图计算系统对比(来源:公开信息整理)
图数据库起源最早可追溯至上世纪面向树状结构和属性图的数据库及模型。
进入 21 世纪,第一款商用图数据库 Neo4j 公司于 2007 年成立,开始采用针对图结构进行优化的原生图存储模式,之后出现的其他图数据库如 CosmosDB 、 OrientDB 、 ArangoDB 等,开始朝着多模态、分布式架构等各个方向探索和发展。
而在图计算系统市场,早期业界常用通用型计算框架(如 MapReduce)等解决方案处理图问题,但它们在性能等方面尚不尽如人意。
2010 年,Google 提出了基于 BSP 模型的 Pregel 分布式图计算系统,与之前方案相比在编程模型、同步控制等方面提供了更优的解决方案;
之后 CMU(卡内基梅隆大学) Select 实验室提出了基于 GAS 模型的 GraphLab 系统,二者为后续其他图计算系统设计带来了深远的影响。
2015 年前,这一阶段的图计算市场依然以海外厂商为主。直至 2015-2016 年左右,随着应用市场逐步打开,国内图计算领域学术界和产业界开始发力,市场热度逐渐提升。
2016 年,清华计算机系师生陈文光、朱晓伟在 OSDI (USENIX Symposium on Operating Systems Design and Implementation)学术会议上发表了《Gemini:以计算为中心的分布式图计算系统》论文,提出了国内图计算系统领域重要成果之一的 Gemini;同时,一批具有深厚学术研究背景的优秀学者开始进入产业界,尝试将已有学术成果转化为落地应用。
不仅蚂蚁、阿里、腾讯等大厂开始根据自身业务需求切入图计算领域展开研究,市场上也涌现出了一批深耕图计算行业的垂直初创企业,共同展开对图计算领域的商业化探索。
从投融资情况市场来看,根据 CB Insights 数据,过去三年间国内外共有近 15 家企业获得了超过 20 笔融资。其中,海外知名图数据库企业 Neo4j 在 2021 年 6 月的 F 轮融资中获得 3.25 亿美元投资,成为数据库历史上最大的一笔投资。
此外,根据知名数据库排名网站 DB-Engines 的 Popularity 指数,按数据库类型来看,自 2013 年以来图数据库一直是受到最多关注的数据库类型,遥遥领先于其他类型的数据库,而且关注热度仍在持续攀升中。
图 | 各类数据库近十年来热度变化(来源:DB-Engines.com)
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢