【AI必学】RAG多跳问答总翻车？SentGraph用“句子级推理图“实现降本增效30%！小模型也能碾压SOTA！-编程实验室

主要关注LLM、RAG、Agent等AI前沿技术，每天分享业界最新成果和实战案例。

一、为什么传统 RAG 会“断链”

单跳场景：把文档切成 200 字左右的 chunk，做向量相似度检索 → LLM 直接答，够用。
多跳场景：需要把 2-4 份文档里的证据拼成一条“推理链”。chunk 粒度粗，一次就带回一整段，里面 60% 是干扰句，关键句反而被淹没 → 链条断了，LLM 开始“胡编”。

作者一句话总结：“不是检索不准，是检索单元太胖，逻辑关系太乱。”

传统 chunk 图 SentGraph 句图[整段1]——相似——[整段2] [S1]—因果→[S2]—对比→[S3]↓ 含 6 句废话 ↓ 句句相关上下文爆炸推理链清爽

二、SentGraph 的“瘦身”思路

把检索单元从“段”缩到“句”，再把这些句子按真正的逻辑关系画成一张三层图，线下建好，线上直接按图索骥。

图长啥样？

Topic 层——跨文档“桥梁”↑Core 句层——核心事实↑Sup 句层——背景、因果、举例

线下建图三步曲

步骤	做什么	关键技术	解决痛点
① 拆句	把文档切成单句	常规 NLI 模型	避免 chunk 冗余
② 找关系	识别句间 12 种修辞关系	精简版 RST（修辞结构理论）	把“因为、但是、例如”显式化
③ 架桥梁	跨文档实体对齐	LLM 生成“实体-关系-实体”三元组	让多文档证据连成一条线

例：
文档 A「克罗地亚官方语言为克罗地亚语。」
文档 B「电影《围城》使用克罗地亚语拍摄。」
系统线下就在 Topic 层建一条边：(克罗地亚语, 被用于, 电影《围城》)

线上推理三步曲

Anchor 初选
用 dense retriever 把“问题向量”和所有句子向量比对，先取 Top-K 候选句。
Anchor 精炼
让 LLM 当“裁判”：

无关句子直接扔掉
证据已够 → 走“直接答”分支
证据不够 → 触发“路径扩展”

路径扩展
从保留的 anchor 出发，沿图中的 N-N、N-S 边做 BFS，把“因果、对比、背景”句子一串一串捞回来，直到凑齐一条完整证据链。

三、实验亮点

数据集	最佳基线 (BGE)	SentGraph	绝对提升
HotpotQA	44.0 EM	48.8 EM	+4.8
2Wiki	36.8 EM	42.0 EM	+5.2
MuSiQue	21.2 EM	26.8 EM	+5.6
MultiHopRAG	63.4 Acc	65.6 Acc	+2.2

token 更省：比最强 chunk-level 图方法 KGP 平均少 30% 输入、60% 输出。
模型更“小”也能用：7B Qwen 上依旧领先 14B 的 chunk 方案。

四、局限 & 总结

建图靠 LLM 写关系，大模型更准，小模型会引入噪声。
目前只针对多跳 QA 做了关系类型精简，别的任务得重新设计。
线下构图计算量不小，后续可探索“增量式”更新。

把检索粒度缩到句，再把句子间的“修辞小箭头”画出来，就能让 RAG 在多跳问答里“少废话、多证据、链条不断”。
SentGraph 用 30% 的 token 做到 SOTA，给“图+句子”这一新范式打样。

SentGraph: Hierarchical Sentence Graph for Multi-hop Retrieval-Augmented Question Answeringhttps://arxiv.org/pdf/2601.03014

每天一篇大模型Paper来锻炼我们的思维~已经读到这了，别忘了点赞、关注噢

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

写论文好用的AI：从辅助构思到质量控制的智能伙伴

在学术研究领域，人工智能已从遥远的概念演进为触手可及的现实助手。对于论文作者而言，“好用的AI”绝非指能够一键生成全文的替代工具，而是指那些能够嵌入研究全流程、切实提升效率与质量、且符合学术伦理的智能伙伴。这些工具能够在文献迷雾…

李华

【Green Hills】Validate授权文件分析和服务端授权部署

1、文档目标分析授权文件的结构和各个功能组件进行对应，为后期排查客户授权问题提供理论基础。记录Helix QAC和Validate服务器端授权快速部署步骤，避免后续出现授权冲突文件，减少售后成本。对QAC授权、Validate授权和license文件间的调用…

李华

打工人救星！用doocs md写公众号必搭cpolar，再也不用卡局域网里改稿了

文章目录1 项目 doocs/md 介绍2 安装Nodejs环境2.1 下载Nodejs安装程序2.2 安装Nodejs程序2.3 验证Nodejs是否安装2.4 设置国内淘宝镜像源3 下载本地部署doocs/md项目3.1 将项目下载至本地3.2 解压doocs/md项目3.3 安装依赖和启动doocs/md项目4 将网站穿透至公网（cp…

李华

小白必看！RAG技术让大模型不再“胡说八道“，5分钟入门检索增强生成

【AI必学】RAG多跳问答总翻车？SentGraph用“句子级推理图“实现降本增效30%！小模型也能碾压SOTA！

一、为什么传统 RAG 会“断链”

二、SentGraph 的“瘦身”思路

线下建图三步曲

线上推理三步曲

三、实验亮点

四、局限 & 总结

学AI大模型的正确顺序，千万不要搞错了

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

写论文好用的AI：从辅助构思到质量控制的智能伙伴

程序员必看！港中大微信AI联合出品HGMEM，让大模型处理长文本像拥有“侦探思维“一样精准

【Green Hills】Validate授权文件分析和服务端授权部署

Invicti Enterprise On-Premises v25.11.0 - 企业级应用安全

打工人救星！用doocs md写公众号必搭cpolar，再也不用卡局域网里改稿了

一、为什么传统 RAG 会“断链”

二、SentGraph 的“瘦身”思路

线下建图三步曲

线上推理三步曲

三、实验亮点

四、局限 & 总结

学AI大模型的正确顺序，千万不要搞错了

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

小白必看！RAG技术让大模型不再“胡说八道“，5分钟入门检索增强生成

写论文好用的AI：从辅助构思到质量控制的智能伙伴

程序员必看！港中大微信AI联合出品HGMEM，让大模型处理长文本像拥有“侦探思维“一样精准

【Green Hills】Validate授权文件分析和服务端授权部署

Invicti Enterprise On-Premises v25.11.0 - 企业级应用安全

打工人救星！用doocs md写公众号必搭cpolar，再也不用卡局域网里改稿了

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】