news 2026/6/15 13:26:53

企业级 Neo4j GraphRAG:向量检索 + 图谱扩散怎么融合?Neo4j GraphRAG 给你答案

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
企业级 Neo4j GraphRAG:向量检索 + 图谱扩散怎么融合?Neo4j GraphRAG 给你答案

系列文章目录

第一篇 AI 数据治理:LangChain4J 文本分类器在字段对标中的高级玩法
第二篇 LangChain4J + OpenTelemetry:AI 调用全链路可观测方案


文章目录

  • 系列文章目录
  • 前言:为什么只做向量 RAG 不够用?
  • 一、GraphRAG 的核心设计
    • 1.1 Schema 自检与自修复(Neo4jSchemaService)
    • 1.2 知识库入库(IngestService)
    • 1.3 实体词表(Neo4jEntityService + EntityCatalogService)
    • 1.4 实体链接(Neo4jVectorEntityLinker)
    • 1.5 融合检索问答(GraphRagService)
  • 二、代码实践
    • 2.1 模型接入:Embedding + Chat(LangChain4jConfig)
    • 2.2 Neo4j Driver 与 RAG 参数(Neo4jConfig + RagProperties)
    • 2.3 GraphRAG 问答入口:/api/rag/ask(RagController)
    • 2.4 实体词表自增长:/api/entity/discover + /api/entity/upsert
    • 2.5 Dto
      • 2.5.1 AskResponse
      • 2.5.2 ChunkRef
      • 2.5.3 DiscoverEntitiesResponse
      • 2.5.4 EntityInfo
    • 2.6 融合检索核心:GraphRagService(Vector + Graph + Fusion)
    • 2.5 启动初始化:Schema 自修复 + Seed + Ingest(GraphRagApplication)
  • 三、配置与示例数据
    • 3.1 application.properties
    • 3.2 entities.json
    • 3.3 md文件数据
    • 3.4 Maven 依赖
    • 3.4 discover / upsert / ask 三连测试
      • 3.4.1 discover:自动发现新术语(可选 autoUpsert)
      • 3.4.2 upsert:手动确认后写入 Neo4j 实体词表
      • 3.4.3 ask:走完整 GraphRAG(向量检索 + 图检索融合)
  • 总结

前言:为什么只做向量 RAG 不够用?


很多团队的 RAG 都止步于:切 Chunk → 向量化 → TopK 相似度召回 → 拼上下文 → 让 LLM 回答。这条链路上线很快,但实际落地后经常遇到三个硬问题:

命中不稳定:问题表达一变,向量召回就漂;尤其是术语、代码 token、配置项这类文本。

解释性弱:为什么命中这段?为什么没命中那段?很难从“纯相似度”讲清楚。

词表维护成本高:新术语、新函数、新产品名层出不穷,靠人手补“实体/别名”永远慢半拍。

所以我做了一个工程化的 GraphRAG :
向量检索 + 图检索融合(Fusion),并且提供一条非常关键的闭环:实体自动发现 → 自动入库 → 立即生效。

一、GraphRAG 的核心设计

✅ GraphRAG 全链路 Mermaid 架构图(流程图)

整体链路

  1. 实体提取/实体链接

    • 从用户问题中提取 m
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/14 18:52:52

Editly容器化部署:革新视频创作工作流的终极方案

在当今数字内容爆炸的时代,视频创作已成为个人表达和企业营销的重要方式。然而,传统视频编辑软件复杂的安装过程、版本依赖冲突以及跨平台兼容性问题,让许多创作者望而却步。Editly容器化部署方案应运而生,彻底改变了这一现状&…

作者头像 李华
网站建设 2026/6/15 14:34:53

7步掌握思源宋体:免费商用中文字体的终极解决方案

7步掌握思源宋体:免费商用中文字体的终极解决方案 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 还在为寻找高质量的中文字体而烦恼吗?Source Han Serif TTF&a…

作者头像 李华
网站建设 2026/6/13 7:54:52

ARP扫描技术深度解析:从原理到实战的完整掌握

ARP扫描技术深度解析:从原理到实战的完整掌握 【免费下载链接】arp-scan The ARP Scanner 项目地址: https://gitcode.com/gh_mirrors/ar/arp-scan 在网络探测技术领域,ARP扫描以其独特的工作机制和高效的设备发现能力脱颖而出。不同于传统的端口…

作者头像 李华
网站建设 2026/6/15 11:51:47

2、CentOS 7安装与命令行使用指南

CentOS 7安装与命令行使用指南 1. CentOS 7介绍 CentOS(Community Enterprise Operating System)是一个快速、稳定且开源的企业级Linux发行版,可用于笔记本电脑、桌面计算机和服务器。它基于Red Hat Enterprise Linux(RHEL)的源代码开发,由CentOS社区维护。CentOS软件包…

作者头像 李华
网站建设 2026/6/14 14:03:58

Joy-Con Toolkit:专业游戏手柄调校工具使用指南

Joy-Con Toolkit:专业游戏手柄调校工具使用指南 【免费下载链接】jc_toolkit Joy-Con Toolkit 项目地址: https://gitcode.com/gh_mirrors/jc/jc_toolkit Joy-Con Toolkit是一款专为游戏手柄深度优化设计的开源软件工具,能够帮助用户实现控制器参…

作者头像 李华