news 2026/6/26 2:34:24

RAG创新了,MCompassRAG装上了语义指南针

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG创新了,MCompassRAG装上了语义指南针

主题元数据当语义指南针

MCompassRAG总览

核心思路切换:不改chunk粒度,给chunk加方向感。

具体流程拆开看——

离线预计算阶段:主题模型编码器把文档和chunk映射到retriever同一嵌入空间的主题向量。每个chunk对应一个主题分布θ_c∈ℝ^K,其中θ_{c,r}衡量主题r在chunk c中的强度。这些分布存在corpus-level元数据银行ℳ里,构成语料 topical结构的离线地图。chunk比query长,主题分布可以可靠计算并缓存,不用每次查询重算。

查询时主题选择:query太短,自己的主题分布不可靠。MCompassRAG不直接用query分布,而是用selection policy把query嵌入和元数据银行ℳ里的条目比对,选出最相关的主题分布。这一步是用检索器嵌入空间内的相似度做的,不需要LLM。

抽象去噪:选中的多条主题分布可能有偏置或噪声。抽象模块把它们汇总成一个refined query-topic分布,压缩成紧凑的query-side topic vector。这个向量就是"语义指南针",告诉retriever粗chunk里哪个语义方向相关。

元数据丰富的表示:query-side topic vector和query嵌入拼接,形成metadata-enriched query representation。chunk端同理,chunk嵌入和chunk主题向量拼接。学生MLP分类器对两侧丰富表示打分,返回top-k。

粗chunk保留效率优势,主题指南针消除语义噪声。

LLM教师蒸馏到轻量学生,推理零LLM调用

MCompassRAG流程图

训练和推理严格分离,这是效率关键。

训练时:

  • LLM teacher用扩展query(query expansion)对每个chunk做相关性监督,产出软标签
  • 学生只用基础query,不享受扩展,必须从元数据丰富表示里学会识别相关chunk
  • 损失函数:BCE(二元交叉熵)+ 知识蒸馏(KL散度对齐教师软标签)
  • 学生是极端多标签分类器(extreme multi-label),一次前向能识别多个相关chunk
  • 训练目标迫使学生学会从主题指南针信号推断LLM教师靠扩展query才能做出的判断

推理时:

  • 只需要四步:query编码 → 元数据选择 → 抽象 → 学生打分
  • 零LLM调用,零查询扩展,零rerank
  • 学生MLP对元数据丰富的query/chunk表示打分,一次前向返回top-k
  • chunk主题分布已离线缓存,查询时只读不计算

查询扩展和LLM打点只在训练时用,部署时学生独立工作。这是MCompassRAG能在延迟上碾压LLM-based基线的根本原因——把贵的东西全部前置到训练阶段。

实验结果

6个benchmark平均IE涨8.24%,延迟降5倍+

实验覆盖6个复杂检索benchmark,包括LegalBench-RAG、Dragonball Finance、DRBench等深度研究型语料。结果硬核:

  • 平均信息效率(IE)提升8.24%over最强非LLM基线
  • 延迟比LLM-based RAG基线低5倍以上
  • 推理时不需要LLM调用,效率和证据质量双提升
  • 击败的基线覆盖了主流高效RAG方案

IE随主题数K变化稳定,学生模型紧跟教师表现,说明主题指南针机制本身鲁棒,不依赖精细调参。embedding backbone和topic model的ablation显示框架对具体实现选择不敏感。

IE随主题数变化

定性验证——指南针真的在导航

LegalBench-RAG定性对比:查询"Superior Proposal"的定义,MCompassRAG精准定位到定义所在chunk,基线被无关语义带偏。

t-SNE可视化更直观:chunk嵌入按主题聚类,query的主题向量精准指向正确cluster。粗chunk不再"瞎摸",指南针把检索方向校准到正确语义区域。

## 学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

t-SNE可视化

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 2:32:50

推荐系统模型更新方式

一、全量训练(Full Retraining)最基础的方式,定期用全量历史数据从头训练一个新模型,训练完成后替换线上模型。更新周期通常是天级别,比如每天凌晨用过去 N 天的数据训练,早上上线新模型。优点是模型质量稳…

作者头像 李华
网站建设 2026/6/26 2:31:11

分形几何中的投影测度:填充维数与阿苏阿德维数的理论与应用

1. 项目概述:从“测量”到“维度”的几何探险如果你在分形几何、动力系统或者几何测度论的领域里摸爬滚打过一阵子,大概率会对“维数”这个概念又爱又恨。爱的是,它用一个简洁的数字,刻画了集合的复杂程度和空间占据能力&#xff…

作者头像 李华
网站建设 2026/6/26 2:30:53

如何快速实现Unreal Engine实时音频导入:5个核心优势详解

如何快速实现Unreal Engine实时音频导入:5个核心优势详解 【免费下载链接】RuntimeAudioImporter Runtime Audio Importer plugin for Unreal Engine. Importing audio of various formats at runtime. 项目地址: https://gitcode.com/gh_mirrors/ru/RuntimeAudio…

作者头像 李华
网站建设 2026/6/26 2:28:58

《离散数学》全套PPT课件(华中科技大学)

《离散数学》全套PPT课件(华中科技大学) 课件 内容: 第一章 集合论.ppt 第一章(续) 集合的运算与分类(改).ppt 第二章 二元关系.pptx 第三章:特殊关系 ppt 第四章:函数.ppt 第五章:…

作者头像 李华