news 2026/6/13 17:38:22

收藏必备!小白程序员轻松入门大模型:RAG架构详解与实践

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
收藏必备!小白程序员轻松入门大模型:RAG架构详解与实践

本文详细介绍了检索增强生成(RAG)架构,旨在帮助初学者理解大模型如何结合外部知识库提升回答的准确性和时效性。文章涵盖了RAG的四种架构类型、黑盒与白盒增强策略、知识库构建、查询与检索增强方法,以及系统评估和优化增强过程。通过本文,读者将学习到如何构建高效的RAG系统,提升大模型在特定领域的应用效果。

导航

传统大语言模型主要依赖参数中的隐式知识进行回答,容易受到知识过期、幻觉和领域知识不足等问题影响。RAG 的核心思想是:在生成答案之前,先从外部知识库中检索相关信息,再将这些信息作为上下文提供给大语言模型,从而提升回答的准确性、可追溯性和时效性。

检索增强生成架构

架构类型是否修改大模型参数是否修改检索器参数代表方法特点
无微调 RAGIn-Context RALM简单、易落地
检索器微调REPLUG适合黑盒大模型
仅语言模型微调RETRO强化模型利用外部知识的能力
检索器与模型协同微调Atlas效果潜力高,但训练复杂

黑盒增强架构

黑盒增强架构指的是不修改或无法访问大语言模型内部参数,主要通过Prompt、外部检索、检索器优化或输出反馈来提升生成效果。

无微调

无微调架构是所有RAG架构中形式最简单的。该架构中,检索器和语言模型经过分别独立的预训练后参数不再更新,直接组合使用。In-Context RALM是该框架下的代表性方法

在实际工程中,大多数企业级 RAG 系统最初都采用这种形式:知识库、Embedding 模型、向量数据库和大语言模型相互独立,只通过 Prompt 将检索结果注入上下文。

检索器微调

在检索器微调架构中,大语言模型参数保持不变,仅通过语言模型的输出反馈来优化检索器。其核心思想是:如果某个文档能让语言模型更容易生成正确答案,那么这个文档就应该被检索器赋予更高权重。

REPLUG 是这类方法的代表之一。它利用语言模型对不同检索文档的困惑度变化作为监督信号,训练检索器更倾向于召回那些能显著提升生成质量的文档。

白盒增强架构

大语言模型和检索器是独立预训练的,二者可能存在匹配欠佳的情况。白盒增强架构通过微调大语言模型来配合检索器,以提升RAG 的效果。根据是否对检索器进行微调分为两类:

  • 仅语言模型微调
  • 检索器和语言模型协同微调
仅微调语言模型

仅微调语言模型指的是检索器作为一个预先训练好的组件其参数保持不变,大语言模型根据检索器提供的上下文信息,对自身参数进行微调。RETRO是微调语言模型的代表性方法之一。

检索器和语言模型协同微调

在该架构中,检索器和语言模型同时进行微调,以实现更好的协同效果。该方法的代表性方法是Atlas。

知识库构建

在RAG 框架中,知识库构建主要涉及数据采集及预处理与知识库增强两个步骤。

数据采集及预处理

  • 数据采集: 来自不同渠道的数据被整合、转换为统一的文档对象。这些文档对象不仅包含原始的文本信息,还携带有关文档的元信息(Metadata)
  • 预处理: 预处理可以提升数据质量和可用性。数据预处理主要包括数据清洗和文本分块两个过程。
  • 数据清洗旨在清除文本中的干扰元素。
  • 文本分块是将长文本分割成较小文本块的过程,文本分块的效果直接影响后续检索结果的质量

知识库增强

知识库增强是通过改进和丰富知识库的内容和结构,以提升其质量和实用性

  • 查询生成 利用大语言模型生成与文档内容紧密相关的伪查询。这些伪查询从查询的角度来表达文档的语义,可以作为相关文档的“键”,供检索时与用户查询进行匹配。
  • 标题生成 利用大语言模型为没有标题的文档生成合适的标题

查询与检索增强

查询增强

查询增强是指在检索阶段对用户输入的查询进行改进和优化,以提升检索结果的相关性和准确性。查询增强的主要方法包括:

  • 查询语义增强: 通过同义改写和多视角分解等方法来扩展、丰富用户查询的语义,以提高检索的准确性和全面性
  • 查询内容增强: 通过生成与原始查询相关的背景信息和上下文,从而丰富查询内容,提高检索的准确性和全面性。查询内容增强方法通过引入大语言模型生成的辅助文档,为原始查询提供更多维度的信息支持

检索器

检索器是RAG系统中的核心组件,负责从知识库中检索出与用户查询相关的文档

判别式检索器

判别式检索器通过判别模型对查询和文档是否相关进行打分。判别式检索器通常分为两大类:

  • 稀疏检索器 稀疏检索器(Sparse Retriever)是指使用稀疏表示方法来匹配文本的模型,通过统计文档中特定词项出现的统计特征来对文档进行编码,然后基于此编码计算查询与知识库中的文档的相似度来进行检索
  • 稠密检索器 稠密检索器一般利用预训练语言模型对文本生成低维、密集的向量表示,通过计算向量间的相似度进行检索
生成式检索器

生成式检索器通过生成模型对输入查询直接生成相关文档的标识符。

检索效率增强

向量数据库可以实现高效的向量检索与查询。向量数据库的核心是设计高效的相似度索引算法。 常用的索引技术主要分为三大类:

  • 基于空间划分: 将搜索空间划分为多个区域来实现索引
  • 基于乘积量化: 将高维向量空间划分为多个子空间,并在每个子空间中进行聚类得到码本和码字,以此作为构建索引的基础
  • 基于图: 构建一个邻近图,将向量检索转化为图的遍历问题

检索结果重排

通过对检索结果重排,可以提升检索结果的相关性和准确性。常见的重排方法包括:

  • 基于交叉编码的方法 基于交叉编码的重排方法利用交叉编码器(Cross-Encoders)来评估文档与查询之间的语义相关性
  • 基于上下文学习的方法 基于上下文学习的方法是指通过设计精巧的Prompt,使用大语言模型来执行重排任务

RAG 系统评估

RAG 系统的评估通常需要同时关注检索质量和生成质量。

检索质量评估

  • Recall:相关文档是否被召回。
  • Precision:召回结果中有多少是真正相关的。
  • MRR:正确文档是否排在靠前位置。
  • nDCG:综合考虑相关性和排序位置。

生成质量评估

  • 正确性:答案是否符合事实。
  • 忠实性:答案是否基于检索到的证据生成。
  • 完整性:是否覆盖用户问题的关键方面。
  • 可引用性:是否能给出明确来源。
  • 幻觉率:是否编造不存在的信息。

优化增强过程

RAG 并不意味着每次生成都必须检索。是否检索、在哪里融合检索结果、是否需要多轮检索,都会影响系统成本、延迟和答案质量。

何时增强

判断是否需要增强的核心在于判断大语言模型是否具有内部知识。判断模型是否具有内部知识的方法可以分为两类:

  • 外部观测法:通过 Prompt 询问模型是否具备相关知识,或通过置信度、困惑度等统计信号进行判断。
  • 内部观测法:通过检测模型内部神经元或隐藏状态判断模型是否存储相关知识。这类方法通常需要访问模型内部参数,更适合白盒场景。

内部/外部观测法都存在一定局限性,最好是定义一个决策链: 规则兜底 + LLM 判断 + 检索质量评估 + 证据充分性验证.

何处增强

可以在输入端、中间层、输出端使用检索的结果:

  • 输入端: 直接将检索到的外部知识文本与用户查询拼接到Prompt中,然后输入给大语言模型,主流方式。
  • 中间层: 先将检索到的外部知识转换为向量表示,然后将这些向量插入通过交叉注意力融合到模型的隐藏状态中。黑盒架构中无法使用。
  • 输出端: 利用检索到的外部知识对大语言模型生成的文本进行校准,是一种后处理的方法

多次增强

  • 分解式增强 将复杂问题分解为多个子问题,子问题间进行迭代检索增强,最终得到正确答案
  • 渐进式增强 将问题不断细化,然后分别对细化的问题进行检索增强,力求给出全面的答案,以覆盖用户需要的答案

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2026 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/13 11:10:25

OpenVic开源引擎:从零构建《维多利亚2》式历史模拟游戏

1. 项目概述:一个开源的历史模拟游戏引擎如果你是一个历史爱好者,同时又对游戏开发,特别是对《维多利亚2》这类深度策略模拟游戏情有独钟,那么“OpenVic”这个名字你肯定不会陌生。简单来说,OpenVic是一个开源的游戏引…

作者头像 李华
网站建设 2026/6/6 3:55:39

5G NR射频特性:从标准到部署的频谱灵活性挑战与实现

1. 5G NR频谱灵活性的核心挑战 5G NR的频谱灵活性是其区别于前几代移动通信技术的核心特征之一。这种灵活性主要体现在三个方面:首先,5G NR需要支持从Sub-6GHz到毫米波(24GHz以上)的广泛频段范围;其次,它要…

作者头像 李华
网站建设 2026/6/13 17:37:12

Spring动画库2024终极指南:Swift开发者的完整动画解决方案

Spring动画库2024终极指南:Swift开发者的完整动画解决方案 【免费下载链接】Spring A library to simplify iOS animations in Swift. 项目地址: https://gitcode.com/gh_mirrors/sp/Spring Spring动画库是一个专为Swift开发者设计的iOS动画框架,…

作者头像 李华
网站建设 2026/5/13 11:06:17

不止于国标:用Mendeley自定义CSL文件打造你的专属文献管理风格

超越标准:用Mendeley自定义CSL打造个性化文献管理系统 在科研写作中,文献引用格式往往被视为一种不得不遵守的"规范",而非可以主动掌控的工具。大多数研究者止步于选择预设的国标GB/T 7714格式,却忽略了Mendeley真正的…

作者头像 李华
网站建设 2026/5/13 11:03:38

在自动化脚本中集成Taotoken api实现智能批处理任务

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在自动化脚本中集成Taotoken API实现智能批处理任务 应用场景类,探讨在数据处理、内容生成等自动化脚本场景中&#xf…

作者头像 李华