第8章：QueryEngine 查询引擎——把检索结果变成答案-编程实验室

1. 项目背景

某公司法务部门在内部部署了一套 RAG 制度问答助手，首批上线了《劳动合同管理办法》《员工考勤制度》《差旅报销规定》等 15 份制度文档。系统运行一周后，业务同事的反馈邮件接踵而至。

HR 小王在群里直接发问："我问’试用期最长多久’，系统回答’一般不超过六个月’，但这是《劳动合同法》的规定还是我们公司自己的规定？回答里一个字都没提来源文件，我哪敢直接用？"财务部的小陈更焦虑：“我问差旅住宿标准，系统第一次说 500 元/晚，第二次说 450 元/晚，第三次又变成 600 元/晚——三次查出来三个答案，这让我怎么报销？”

更麻烦的是，当答案明显有误时，开发团队完全无力排查——日志里只看到一个模糊的问题和一个最终回答，中间环节到底是检索时漏了关键文档，还是 LLM 合成时自由发挥了，毫无线索。法务总监用一句话总结了困境：“一段没有出处的法律意见书，你敢提交给仲裁庭吗？”

痛点一：答案无引用来源 → 用户无法验证可信度 → 幻觉和脑补不可控 痛点二：回答不稳定 → 相同检索结果每次合成不同 → 缺乏一致性 痛点三：调试不可见 → 检索与合成黑盒 → 排障靠猜

默认的index.as_query_engine()一行代码确实能跑通，但它就像一个只会背答案但从不标注出处的实习生——能力有，但不专业、不可信、不可控。本章将剖析 QueryEngine 从检索到合成的完整链路，并实战构建一个每次回答都附带引用文件与条款号的制度问答助手。

2. 项目设计

场景：团队会议

高可用部署：Redis Stack 集群模式下的检索性能

系列导读你现在看到的是《Redis Stack AI 检索实战：从向量引擎到智能应用的全栈指南》的第 7/10 篇，当前这篇会重点解决：指导读者将 Redis Stack 检索系统从单机扩展到集群，确保生产环境的可用性和稳定性。上一篇回顾：第 6 篇《缓存策略进化：从传统缓存到 AI 向量缓存…

李华

生产级、多 IDC / 多业务 / 多 upstream 的 Nginx 架构方案-003篇

文章目录 📦 交付总览一、IDC 级灰度发布（按 Cookie / Header / IP） 1️⃣ 灰度 upstream 定义 2️⃣ 按 Cookie 灰度（最常用） 3️⃣ 按 Header 灰度（CI/CD / 运维专用） 4️⃣ 按 IP 灰度（内测 / 白名单）二、Upstream 动态权重（Consul / Nacos）方案 A：Consul +…