书名:Graph+AI:大模型浪潮下的图计算

年份:2024

下载链接:

链接: https://pan.baidu.com/s/1RYNiTvhG7cdNwZEQtyLwxQ?pwd=xtxm

书籍汇总:

链接: https://pan.baidu.com/s/1FFw_24YdJIUfLGunRGT_7g?pwd=9at9

链接: https://pan.baidu.com/s/1wp1sxh_p5Cv9dI5OpBaSCg?pwd=2arp


图片
图片

图片
图片

3.2 图神经网络

GNN通过深度学习的方法自动学习图的结构特征,从而提高了模型的性能和泛化能力。涉及了常见的卷积算子GCNConv、SAGEConv、GATConv等,以及池化算子SimplePool、DiffPool、gPool等。GNN通过堆叠多个图广播层为图中的每个节点生成一个包含聚合邻居信息和特征信息的嵌入表示,每一层的计算模式可以被抽象成四个计算步骤:ScatterToEdge, EdgeForward, Gather & Aggregate, Vertex Forward。在异构环境中如何进行高效的分布式训练阶段与推理,以及可信图学习也是当下热点的研究方向。

图片

3.3 图基础模型

图神经网络和大型语言模型的融合引起了广泛的关注,图基础模型是在广泛的图数据上进行预训练并能够适应多种下游图任务的模型。其核心能力包含:缩放法则、同质泛化能力,多任务适应性、图推理能力。当下的研究路径主要围绕在:构建大规模多样化的图数据集、图结构的高效表达、增强LLM的图理解和推理能力,以及基准测试等。

图片

3.4 知识图谱

知识图谱属于人工智能领域符号主义的典型代表,用三元组描述事物之间的复杂关系,包含图结构数据、文本数据、逻辑规则等。大语言模型在语言理解方面的突破,为知识图谱的表示、抽取、补全和服务带来新的技术变革。

首先,知识表示向着能表示更深度的语义和更广泛的语义发展;其次,知识抽取的泛化性提升和成本的降低让构建大规模知识图谱成为可能;再者,知识补全从依赖图结构的补全向着混合依赖图结构和文本的方向发展,可以更充分地利用知识图谱中图结构和语义信息;最后,知识图谱服务的方式多样性逐渐增加,除了检索查询这类传统服务方式,还发展出了辅助大模型思维链等方式。

图片

3.5 Text2GQL

为了提升用户通过自然语言与图数据库交互的体验,将自然语言翻译为图查询语言几乎是最基本的诉求。然而图查询语言并非像SQL广泛普及,训练语料的不足和测试基准的缺失给Text2GQL带来了巨大的困难。为此,蚂蚁TuGraph团队提出了“语法制导的语料生成”策略,为高质量的GQL语料合成提供了有效的方法,并实现了完整的GQL微调链路和评估方案。实际测试下来,TuGraph团队提供的Text2GQL微调模型的测试准确率可以达到92%以上。

图片

3.6 图系统优化

将图系统LLM相结合,可以实现更深入的语义理解、更精准的决策支持、高效的信息检索和个性化交互等。

主要目标有:

1. 查询性能优化:通过优化图数据库和图处理引擎,减少查询响应时间,提高图数据的访问效率。

2. 运维自动化:能够适应动态的数据规模和业务需求,实现系统的扩展伸缩、诊断调优。

3. 存储效率优化:合理利用存储空间,降低存储成本,同时确保数据的完整性和一致性。

4. 系统安全增强:建立完善的安全机制,防止数据泄露、误操作等安全问题。

5. 产品体验优化:提供友好的用户界面和便捷的操作方式,使图系统易于使用和管理。

图片

3.7 GraphRAG

检索增强生成 RAG(Retrieval Augmented Generation) 是一种将检索和生成相结合的技术框架。在生成答案时,RAG不仅依赖于预训练模型的内部知识,还通过从外部知识库中检索相关信息来增强生成过程。知识库作为RAG链路的核心组件,直接影响了知识的存储与召回。融合索引可以更好地应对多样化的应用场景,GraphRAG使用了基于图谱的知识索引格式,在知识的确定性和可解释性上充分利用了图数据结构的天然优势。

图片

3.8 智能体

尽管大语言模型已经具备了一定的思考与决策的能力,但将其与现实世界打通,具备与跟实际环境交互的能力,初步具备类人的自主工作的能力,还需要很多工作要做,包括角色、记忆、思考规划以及行动等。智能体工作流、多智能体协作、思维链等可以与图技术深度结合,充分发挥图数据在规划、编排、关联分析等方面的优势。

图片

4. 解决方案

4.1 申请反欺诈

基于图数据库+AI的技术架构解决方案,将实时/准实时/离线多种技术场景融合,支撑在申请反欺诈场景中的各类业务需求。

图片

4.2 企业决策智能化

基于关联分析的企业决策智能化解决方案旨在为企业提供智能化的数据关联分析决策支持,通过先进的图数据处理方法和持续的模型管理能力,帮助企业在复杂的商业环境中迅速作出明智决策。

图片

4.3 安全风控

蚂蚁集团建设了基于图算法分析的安全风控解决方案,基于关系视角的风险描述、基于全面的风险数据,构建风险关系网络,形成风控知识图谱,实现风控全链路的图数据应用。基于蚂蚁集团TuGraph图数据管理平台,沉淀了包含图特征、图算法、图组件的一体化图运营平台,通过图数据刻画复杂风险模式,通过图计算进行即时风险防控,通过图应用实现规模化风险运营。

图片

4.4 图异常检测

在现代数据驱动的商业环境中,随着数据量的快速增长和关系复杂性的提升,异常行为往往隐藏在复杂的关联网络中。这在金融反欺诈、网络安全和供应链管理等关键领域尤为明显。通过对数据中的节点、边及其关系进行深度分析,该方案能够识别复杂的异常模式。

图片

4.5 图检索增强生成

悦数的图检索增强生成技术方案,旨在构建一个代理式知识库管理与知识推理应用平台,支持用户根据不同用途和特征来管理知识,并针对不同类型的知识文档采用不同的索引方式,提升了系统的通用性和可扩展性。

图片

4.6 知识增强生成

近年来,越来越多的研究聚焦于将RAG技术融入到大语言模型中,以弥补其在事实信息上的不足,如GraphRAG,即采用图结构来优化检索机制。但即便引入RAG技术,将特定领域的知识库或事实文档提供给大型语言模型进行重新生成时,仍不能完全保证生成答案的准确性。针对以上大模型垂直领域应用的关键问题,蚂蚁集团经过了大量探索,构建了面向专业领域的知识增强生成技术框架 KAG(Knowledge-Enhanced Generation)。

图片

4.7 知识抽取框架

蚂蚁集团与浙江大学依托多年积累的知识图谱与自然语言处理技术,联合构建和升级蚂蚁百灵大模型在知识抽取领域的能力,并发布中英双语大模型知识抽取框架 OneKE。OneKE 主要聚焦基于 Schema 的可泛化信息抽取,采用了基于 Schema 的轮询指令构造技术,专门针对提升大模型在结构化信息抽取的泛化能力进行了优化,旨在通过提供中英双语、可泛化的大模型知识抽取,OneKE 在一定程度上具备统一、通用、可泛化的知识抽取能力。

图片

5. 应用案例

5.1 能源电力

在某电力调度控制中心,悦数图数据库的应用极大地提升了调度控制的效率和准确性。

图片

5.2 信用卡反欺诈

某银行信用卡中心采用了创邻科技的Galaxybase图数据库与图计算技术相结合的解决方案。这个系统整合了来自银行内部和外部的多种数据,建立了一个覆盖数十亿条记录的信用卡申请网络图谱。

图片

5.3 存款流失预警

基于TuGraph图系统建设的分析系统,可以通过账户的交易和联系,挖掘更多特征,用于学习预警模型。除个体维度的特征外,增加账户交易的特征,捕捉账户间联系,自动学习拓扑模式,建立更加精准的分类模型。

图片

5.4 交易风控

通过基于图计算思想的子图模式匹配算法(Subgraph Pattern Matching),可以将多个节点(账户、交易、联系信息)和边(交易流、联系链)构成的关系图作为一个整体进行分析,识别出与典型洗钱网络类似的子图,从而挖掘出整个洗钱的模式与结构,帮助银行快速定位团伙。

图片

5.5 跨境电商风控

利用图风控技术充分挖掘案件定性相关的交易信息,实现更快更准的风险定性。在国际电商场景中,盗卡风险分为无关联性的单点风险和呈现批量性的团伙风险。

图片

5.6 芝麻信用

基于TuGraph图智能模型,构建基于半监督中介拓展的团伙识别框架,不再仅仅关注一层的风险,而是通过资金、媒介等关系,提取租赁用户的历史交互子图。

基于TuGraph建设的职业图谱,统一各场景数据,还能完善用户画像,有助于带来场景增益、提升用户人岗匹配的效果。

图片

5.7 犯罪网络检测

在犯罪网络分析领域,图技术展现出了独特的优势。它通过节点、边和属性的结构,能够直观而有效地展示各实体之间错综复杂的关系和交互模式。ArcNeural不仅具备强大的图数据处理能力,还可以同时处理文本、图像、音频等多种数据类型,为犯罪网络检测提供了全方位的技术支持。

图片

5.8 游戏

为了更全面地刻画游戏,腾讯构建了名为“游谱”的游戏垂直领域知识图谱,这是一个多模态的知识图谱,汇聚了全球约 200 万款游戏实体,涵盖主机、PC 和手游三大类游戏。通过多模态知识图谱的构建,能够更深入地理解游戏,并为游戏推荐、评估、运营等场景提供更精准的数据支持。

图片

5.9 地球科学

利用大模型的数据汇聚、理解与推理能力,从海量科学文献中自动挖掘有价值的实体、关系及属性,辅助科学家建立地学全领域最完整的知识图谱和有学科纵深的地学知识体系。同时,利用知识图谱对地学学科体系化的建模与表示,为大模型提供可靠的信息检索服务,能有效提升模型的分析推理能力,在关系推理、逻辑推理和推断任务中提高准确性,减少大模型的幻觉,提高可解释性。

图片

5.10 生命科学

通过将科学事实、理论、实验数据、研究成果及科学家之间的关联以图谱的形式组织起来,生命科学知识图谱能够增强科学理解的深度、促进新发现以及加速科学传播,为解决复杂科学问题提供强有力的支持。

图片

5.11 物理学

无论是在宏观还是微观,大量的物理系统都可以构建成图,并通过图神经网络进行模拟。

图片

5.12 材料学

将晶体或者多晶构建成图,通过训练图神经网络来实现性质的预测,以及给定材料性质的结构生成。

图片

5.13 运筹学

运筹学中大量组合优化问题可以用图来表示。借助图神经网络提取优化问题的特征,以更有效地用求解器求解这些问题。

图片

6. 总结

本次发布的Graph+AI白皮书中,我们系统地探讨了图技术与人工智能的结合应用,涵盖了从基础技术到实际应用的各个方面。未来图技术与大模型的结合将进一步推动人工智能的发展,带来更多创新和突破。

• 图技术与大模型的融合:将图结构信息融入大模型中,可以显著提升模型在复杂关系和结构化数据处理方面的能力。同时训练基于图的基础模型,可以进一步提升图技术的应用广度和深度。

• 跨领域应用的扩展:图技术在各个领域的应用潜力巨大,未来将看到更多跨领域的应用。

• 增强解释性和可解释AI:图技术在提升模型解释性方面具有独特优势,对于构建可信赖的人工智能系统至关重要,尤其是在涉及敏感数据和决策的应用场景中。

• 大规模图数据处理:提升图算法的效率和可扩展性,开发能够处理超大规模图数据的分布式计算框架和优化算法,从而支持更大规模和更复杂的图应用。

• 开放图数据和标准化:通过建立统一的数据标准和共享平台,可以加速图技术的研究和应用,推动整个生态系统的发展。

通过不断探索和创新,图技术将在未来的人工智能发展中发挥越来越重要的作用,我们期待看到更多的研究突破和应用创新,共同推动图技术的进步与发展。

图片

欢迎关注TuGraph代码仓库✨

TuGraph-DB 图数据库

https://github.com/tugraph-family/tugraph-db

TuGraph-Analytics 流式图计算引擎

https://github.com/tugraph-family/tugraph-analytics

TuGraph-AGL 图学习引擎
https://github.com/tugraph-family/tugraph-antgraphlearning




图计算技术的生态上下游

这张「十字路口图」是借助Claude绘制的一个简单的图计算技术生态上下游关系。从纵向关系看,图分析与图可视化与用户距离更近,也更容易借助AI技术提升用图的效率与体验。从横向关系看,图计算技术本身就有数据库(图数据库)与大数据(图计算引擎)双重属性,参考「Data+AI」的技术结合思路也不失为一种高效的选择。当然,也不能忽略Graph自身与AI技术直接结合的思路,这个很有意思,最能体现图自身的特色,后边我会展开来讲。

3. Graph + AI

在2024年探索Graph+AI技术的过程中,我们还联合之江实验室以及各大高校和企业撰写并发布了《Graph+AI:大模型浪潮下的图计算》白皮书,从数据、算法、应用三个方面全方位论述「Graph+AI」技术结合点。涵盖了图数据构建、图神经网络、图基础模型、知识图谱、GraphRAG等热门技术,深度解读了AI时代的图计算技术应用场景和产业价值。接下来,我会结合图计算的生态上下游,重点阐述应用层面图计算的开源探索与思考。

Graph+AI白皮书

3.1 Converged Index

融合索引是提升大模型「用数能力」的关键技术,自2024年中Rockset被OpenAI收购后,融合索引技术开始逐步深入到数据库和数仓系统中,甚至形成了“在数据仓库上面扩展向量检索和语义检索并不困难,但是反之不行”这样的结论。Rockset的存在打通了「大数据」与「大模型」之间的“桥梁”,后续我们也看到了大量的主流数据库和数据仓库开始提供了向量索引的支持。当然TuGraph也不例外,我们在原来图、表索引的基础上,扩展了全文、向量索引的能力,并在未来随着多模态技术的发展,逐步支持图片、音频、视频等多模态索引能力,持续增强图数据分析能力。

图数据库的融合索引

3.2 OSGraph

图可视化技术可以说是图计算领域最经典的应用技术了,由于图数据结构的天然复杂性,借助图可视化组件(如AntVG6)可以大幅降低图数据的理解成本。再漂亮的可视化工具,本质目的还是为了「数据洞察」服务的。从2024年初,我们尝试基于GitHub的真实数据,构建「开源图谱洞察」工具OSGraph,用于分析开源社区的项目和开发者的活动和关系。

示例中,我们通过OSGraph项目自身的「项目贡献图谱」开始,找到项目的关键开发者KingSkyLi、zhongyunWan等,并能发现X-lab实验室的will-ww、frank-zsy、xiaoya-yaya等。同时也可以关联到graph、database等技术领域,以及TuGraph社区等。

OSGraph多跳图谱示例

当前OSGraph已正式发布2.0版本,完成了从「图可视化」到「图数据洞察」的升级,下一步我们的目标是「图智能洞察」。借助于大模型能力,构建开源图谱上的数据增强、智能分析能力,实现更灵活和自由的开源数据探索。

3.3 Text2GQL

关于Text2SQL技术,相信很多人已经耳熟能详,也是数据库结合大模型技术的最早场景,为数据库上的自然语言交互形态提供了基础能力。而在图数据库领域,存在一个非常基础的挑战:图查询语言缺少广泛普及的统一标准。ISO/GQL标准也是2024年4月份刚刚发布的,这导致了Text2GQL语料的极度匮乏,因此构建图数据库上的自然语言查询能力的首要工作是进行Text2GQL的语料合成。

Text2GQL语料合成

我们从2023年底就开始了Text2GQL的建设工作,构建了「语法制导的语料生成」方案,为图查询语言微调提供了必要的语料合成基建,最终通过OSPP项目联合社区开发者完善了此方案,并将源码开放到Awesome-Text2GQL项目。同时,Text2GQL的合成语料和微调模型也开放到DB-GPT-Hub项目中,预测准确率达到92%以上。

Text2GQL微调模型

借助Text2GQL微调模型能力,增了强图查询的自然语言理解能力,这为GraphRAG的查询理解链路建设提供了重要的基础。

3.4 GraphRAG

2024年4月底,微软发表了GraphRAG论文,引爆了GraphRAG技术热。我们也在5月中联合DB-GPT社区共同发布了业内第二个GraphRAG框架,并对其做了持续改进。

  • 2024年05月:发布DB-GPT GraphRAG框架,兼容向量、图、全文索引。
  • 2024年08月:图团队发布行业首篇GraphRAG综述。
  • 2024年09月:支持社区摘要和混合检索,索引成本降低50%。
  • 2024年12月:支持文档结构图谱,索引成本降至40%,性能提升20%。
  • 2025年01月:支持向量驱动检索以及文本驱动检索,集成Text2GQL能力。

随着GraphRAG链路的持续改进,我们逐渐体会到Jerry Liu在LlamaIndex技术报告中提出的:「RAG的尽头是Agent」这个观点了。因此对于GraphRAG,下一阶段演进方向将会是GraphAgent,即「图智能体」。同时GraphRAG将作为智能体关键技术组件,以「知识库」或「记忆系统」的形式而继续存在。

GraphRAG的混合检索

3.5 Chat2Graph

还记得2024年初我写了一篇关于LangChain的工程化解读文章,描绘了LangChain是如何从LLM开始逐步构建自身Agent的技术路径的。经过这两年大模型应用技术的发展,我们对这个过程的认知也越来越清晰:「既然大模型的幻觉不可避免,那么引入诸多改进技术的最终结果一定是智能体」。

从LLM改进直到Agent

关于大模型应用技术,业内有句不成文的说法:「23年卷SFT,24年卷RAG,25年卷智能体」。这与我们这两年在「Graph+AI」的实践技术路线也是相当吻合,2025年,我们也即将开源图数据库的多智能体系统Chat2Graph「An Agentic System on Graph Database」,借助智能体实现真正的「与图对话」。

Chat2Graph:图数据库多智能体系统

3.6 Graph Native

综上所述,不管是在图分析、图可视化方向的纵向探索,还是模型微调、RAG、智能体等方向的横向探索,借助开源社区「生态上下游」的理念,我们在2024年取得了诸多技术建设成果。但这也为我们自身设置了新的枷锁:不知不觉中我们成了技术的“搬运工”,一直在用「迁移学习」的方式将相关技术“复刻”到图计算领域。比如,融合索引复刻了Rockset、OSGraph复刻了OSSInsight,Text2GQL复刻Text2SQL、GraphRAG复刻VectorRAG。

因此,我们需要从「图原生」的角度出发,思考图真正的价值是什么,从「借鉴生态」到「赋能生态」,这是我理解的「回到社区」。Chat2Graph虽然也参考了部分常见的Agent的技术,但在这个系统中,我们更想体现的是Graph在Agent生态中独有的价值,我们想把这块独特性一并做到Chat2Graph中。

回顾过往近十年的蚂蚁图技术建设和应用实践,我认为最有价值的地方不仅体现在业务规模和经济效益上,还有对图的理解与认知。如果一定把这种认知压缩成一个关键词,我认为应该是「连接」。连接可以直观地描述确定性和必然性,连接也可以表现为稳定性和可解释性。插入个彩蛋,图中有句话我特别喜欢:「存在不是实体的集合,而是关系的场域」,这句话是「李继刚」使用提示词引导Claude生成的,我深为共鸣。

图的原生价值思考

近来我经常引用人工智能的三大流派「符号主义」、「连接主义」、「行为主义」的内容,因为我觉得用这个去描述「Graph+AI」的思想来源特别的合适。

人工智能领域的三大流派

这里最想展开的是「符号主义」与「连接主义」的交叉结合部分,其中最典型的代表技术是GraphRAG和KAG。前者倾向于基于知识图谱检索增强大模型生成上下文,后者侧重于知识图谱的直接推理。虽然前边一直在描述图的「连接」本质 —— 确定性与可解释性,好像只是「符号主义」的范畴,但事实上图技术已经深度融入到AI技术栈中,其实只看技术名词便能体会得到:「连接主义」、「神经网络」。因此图技术的应用前景,远不止「符号主义」与「连接主义」结合的单一路径。

这里我结合从LLM到Agent的演进路径,探讨一下图技术的结合点:

  • LLM:仿生大脑,神经元连接规模化后涌现智能,神经网络是最直观的计算图。
  • 推理:仿生思考,解决复杂问题,思维链(COT)、树形思考(TOT)、图形思考(GOT)。
  • 记忆:仿生海马体,感知记忆、短期记忆、长期记忆的分层记忆管理,维护记忆信息的连接。
  • 工具库:仿生四肢,复杂的工具调用自动形成顺序和依赖图。
  • 知识库:仿生图书馆,提供更准确的知识关联,典型代表知识图谱。
  • 智能体:仿生个人,汇集大脑、思考、记忆、工具库、知识库构成完整个体,并具备外部感知交互能力。
  • 多智能体:仿生社会,构建复杂任务规划图,多智能体协作构成通信图。

我们用更广义的仿生去理解大模型与智能体,会发现图技术几乎无处不在,究其原因只能归结为「事物的普遍联系性」了,或许到这里我们才开始摸到图计算在AI时代的一些「脉搏」,未来我们会在Chat2Graph这个项目中做持续的落地与验证。

4. TuGraph开源

回顾2024年,不知不觉中我们在探索「Graph+AI」技术演进过程中,逐步形成了如下的开源技术产品矩阵。从Graph Infra层已经/即将开源的图计算基础能力,结合上层的Text2GQL、GraphRAG的AI Infra层建设,逐步打造并完善图数据库多智能体系统Chat2Graph,并将其赋能到OSGraph和更多的应用层场景中去。

TuGraph开源产品矩阵

作为布道师,需要同时touch到技术、内容和社区三个维度。关于开源,我们一直奉行的准则是:「技术是核心,通过技术迭代产出优质内容,既而影响社区」。对社区来说:「通过优质内容发现有用的技术,既而赋能自身的应用场景」。这是个双向反馈的过程,我们会持续在保持「开发者关系」(DelRel)、「公共关系」(PR)和表达关系三个维度上持续深耕。比较可喜的是,经过2024年「Graph+AI」路径上的持续探索,TuGraph在开源社区综合指标(OpenRank)上,逐步领先于同类产品,这进一步坚定了我们对这个技术方向的投入和信心。

TuGraph布道与社区

也正式归功于在「生态上下游」这个大方向的探索与实践,TuGraph有幸拉动了DB-GPT、AntV、X-lab、OpenSPG、OceanBase、VSAG、Libro等社区的联合共建,并获得到2024年度OpenStar最佳SIG组奖项。在此,对蚂蚁开源委员会、蚂蚁开源办公室的认可,表示特别的感谢。

OpenStar 2025最佳SIG组

后记

其实想聊的还有很多,局限于篇幅,我只能把最想和大家分享的感受列举如上。实际上「Graph+AI」的开源技术领域远不止如此,受制于我个人的工程知识背景,并未对大模型训练过程与图技术的结合做更多展开。最后,还有几个特别的点想稍微提及一下,因为我觉得2024年少了这些会有点不太完整。

首当其冲的,是「提示工程」(Prompt Engineering)。相信不少人对这个技术领域多少有一些偏见,甚至不乏有人觉得这压根不是什么技术领域,更有人将提示工程师比作「巫师」,提示词是他们发出的「咒语」。在这里我想表达的是,提示工程虽然看起来不像写代码那么「科学」,但并不代表它不具备「逻辑」,大模型时代我们可能需要更「哲学」的思维,这点在优秀的提示工程师身上几乎是必备的素养。关于这些,大家可以参考我访谈「李继刚」的交流稿,看完可能会有不一样的感受。

另外,随着大模型能力的持续增强,提示词的重要性将会越来越高。如果你正在开发智能体,试想一下你在针对应用场景不断优化智能体的过程中,有多少时间是在修改提示词?或许会有人质疑说,那这样我们还做智能体做什么,直接攻坚提示工程不就完了,甚至不少提示工程师也是这么认为的。但这里,我就抛出一个问题,暂时不给出我的答案,大家可以带回去细想,可能会有别样的收获。

最后,不得不提及刚发布的DeepSeek-R1了,结合着前阵子吃瓜的gpt-4o-mini可能是8B模型,大家有没有发现我们所熟知的大模型正在朝着小模型、低成本的方向加速迭代。这也就意味着,那些过去只有在带GPU的服务器上才能运行的模型,将来必然会出现在每个人的手持设备上,而且推理质量和性能甚至比当下最好的大模型都要好。那么,人手一个「最懂你的AI助理智能体」将不再是问题,TA可能比你自己还要了解你,帮你购物、订餐、开会、写作,相当于24小时的私人秘书。再结合多智能体系统协作的思路,当你的微信群、钉钉群里,大部分时间是智能体之间在沟通,而你只需要和智能体保持必要的信息对齐即可,这将会给个人和社会带来多大的改变?不敢细想!!!

言至于此,不觉已是深夜,就此打住!

祝大家新春快乐,蛇年大吉!!!

参考

  1. Graph+AI白皮书:https://mp.weixin.qq.com/s/fxwMJ83NFNt2hmNBuUgzoghth、
  2. 融合索引:https://rockset.com/blog/converged-indexing-the-secret-sauce-behind-rocksets-fast-querieshttps:h
  3. 泼天富贵,OpenAI收购数据仓库公司,为什么?:https://https://mp.weixin.qq.com/s/ZKLFOQjjftHGWXDfgaq4PwOQjjftHGWXDfgaq4Pw
  4. TuGraph融合索引:https://github.com/TuGraph-family/tugraph-db/blob/v5.x/docs/development_guide.mdhttps://  、、/v5.x/docs/development_guide.md
  5. AntV G6:https://https://github.com/antvis/G6
  6. OSGraph:https://osgraph.com
  7. OSGraph项目:https://github.com/TuGraph-family/OSGraphht
  8. X-lab社区:https://https://github.com/X-lab2017
  9. TuGraph社区:https://https://github.com/TuGraph-family
  10. OSGraph 2.0:https://https://github.com/TuGraph-family/OSGraph/releases/tag/v2.0.0ly/OSGraph/releases/tag/v2.0.0
  11. ISO/GQL:https://www.gqlstandards.org
  12. 语法制导的语料生成:https://https://mp.weixin.qq.com/s/rZdj8TEoHZg_f4C-V4lq2A8TEoHZg_f4C-V4lq2A
  13. Text2GQL开源之夏项目:https://https://mp.weixin.qq.com/s/PCV4Qi9w9K-tRf1vMWHpEQQi9w9K-tRf1vMWHpEQ
  14. Awesome-Text2GQL:https://https://github.com/TuGraph-family/Awesome-Text2GQLly/Awesome-Text2GQL
  15. 微软GraphRAG论文:https://https://arxiv.org/abs/2404.161300
  16. DB-GPT项目:https://https://github.com/eosphoros-ai/DB-GPT/DB-GPT
  17. DB-GPT GraphRAG:https://https://mp.weixin.qq.com/s/WILvYFiKugroy9Q_FmGriAFiKugroy9Q_FmGriA
  18. GraphRAG综述:https://https://mp.weixin.qq.com/s/Dx8pYhmbrhtRMXNez_GOmwYhmbrhtRMXNez_GOmw
  19. 社区摘要增强:https://https://mp.weixin.qq.com/s/LfhAY91JejRm_A6sY6akNAY91JejRm_A6sY6akNA
  20. 文档结构图谱:https://https://mp.weixin.qq.com/s/EQ3QnWWt1v9_S79MdRaJlwnWWt1v9_S79MdRaJlw
  21. 向量驱动检索:https://https://github.com/eosphoros-ai/DB-GPT/pull/2200/DB-GPT/pull/2200
  22. 文本驱动检索:https://https://github.com/eosphoros-ai/DB-GPT/pull/2227DB-GPT/pull/2227
  23. LlamaIndex技术报告:https://https://mp.weixin.qq.com/s/wuyMN7CLAT9HGYlmjLWUtAN7CLAT9HGYlmjLWUtA
  24. LangChain的工程化解读:https://https://mp.weixin.qq.com/s/9HtxRuyzavovC9NytzCDIgRuyzavovC9NytzCDIg
  25. KAG项目:https://https://github.com/OpenSPG/KAG
  26. OpenSPG社区:https://https://github.com/OpenSPG
  27. OceanBase社区:https://https://github.com/OceanBase
  28. VSAG社区:https://https://github.com/antgroup/vsag
  29. Libro社区:https://https://github.com/difizen/libro
  30. 李继刚访谈:https://https://zhuanlan.zhihu.com/p/749427795494277954
  31. DeepSeek-R1:https://https://github.com/deepseek-ai/DeepSeek-R1
  32. gpt-4o-mini可能是8B:https://mp.weixin.qq.com/s/bT_w-T9ElmPUXbYA1f7kC


微信群

内容中包含的图片若涉及版权问题,请及时与我们联系删除