AI人工智能-RAG方法-第十四周（小白）-编程实验室

RAG是Retrieval Augmengted Generation(检索增强生成)的缩写，核心逻辑特别好理解——就像我们写作文时，先查资料再动笔，而不是凭脑子硬记硬写。

简单说：AI回答问题时，不会只靠自己“记住”的知识，而是从外部文档库（或搜索引擎）里检索出和问题相关的“参考资料”，再把这些资料和问题一起传给大模型，让大模型基于“参考资料”生成回答。

它解决的核心问题是大模型的痛点——模型幻觉（就是AI瞎编答案）

可扩展性强：不用把AI模型做的超大（省成本），想加新知识直接更新文档库，不用重新训练模型。比如公司出了新产品，直接把产品手册放进文档库，AI 就会回答相关问题，不用改模型。
准确性高：回答基于真实文档，少瞎编。比如医疗 AI 用 RAG 查《柳叶刀》论文，不会乱给治疗建议。
可控性好：知识能随时更、定制化。比如政策变了，替换文档库里的旧政策文档，AI 就会按新政策回答。
可解释性强：能告诉用户“答案来自哪”（比如某本书某页、某份表格），不像纯大模型“凭感觉”回答，适合需要溯源的场景（比如医疗、法律）
多功能性：能做回答、总结、聊天等。比如既能回答 “什么是 RAG”，也能总结 RAG 的优势，还能和用户聊 RAG 的应用场景。

（图片里红色框是“容易出错的地方”，下划线是“必须做的步骤”，分两大流程）

原始文档可能是PDF,Word,Excel，网页等，格式乱、内容杂，必须先“整理”，目标是3个：

处理后是这样：

一、Agent是什么 Agent翻译过来时“智能体”，你可以把它理解为一个“有自主能力的智能助手”——它不用人一步步指挥，能自己理解任务，规划步骤、使用工具、记住过往经历，甚至和其他Agent或人类协作，最终完成目标。简单说：普通LLM是“你问我答”的工具，二Agent是“你交…

李华

B站：啥都会一点的研究生公众号：啥都会一点的研究生最近一周AI科技圈又发生了啥新鲜事？ Qwen3-TTS全家桶开源 Qwen3-TTS系列模型正式开源，包含1.7B和0.6B两种参数规模，基于自研Qwen3-TTS-Tokenizer-12Hz多码本语音编…

李华

大数据领域中RabbitMQ的消息积压问题解决关键词：RabbitMQ、消息积压、吞吐量优化、消费者负载、流量控制、死信队列、分布式架构摘要：在大数据处理场景中，RabbitMQ作为主流的消息中间件，常因流量突增、消费者处理能力不足等问题导…

李华

励磁电感 Lm 选对了，LLC 才真“高效”：半桥 LLC 效率优化 🎯🚗🔥 你有没有遇到过这种 LLC：参数一套下来，ZVS 也有了，波形看着也“挺谐振”，但一上功率——MOSFET 发热、次级二极管发热、变压器也热，效率就是死活上不去。然后你开始怀疑人生：不是说 LLC 天生高效…

李华

目录手把手教你学Simulink 一、引言：为什么“风电变流器必须用SVPWM”？ 二、SVPWM 基本原理 1. 八个基本电压矢量 2. 合成参考电压矢量 Vref 3. 扇区判断与作用时间计算步骤： 4. 开关序列（7段式对称） 三、…

李华

一、本文介绍 🔥本文给大家介绍使用APCM 模块改进 YOLO26网络模型，可在特征提取阶段通过像素级的局部–全局协同建模动态增强目标区域特征并抑制复杂背景噪声，使网络在低对比度和复杂场景下更容易区分目标与背景。该模块结构轻量、无需复杂参数，能够在不显著增加计算开销…

李华