人工智能实战:RAG 多路召回怎么做?从单一向量检索召回不足到 BM25、向量、标签与重排融合
一、问题场景:向量检索很智能,但就是找不到关键文档
很多 RAG 系统最开始只用向量检索:
query → embedding → vector search → top_k docs这个方案简单、通用,语义效果也不错。
但上线后会发现,有些问题向量检索并不稳定。
尤其是:
1. 专有名词 2. 编号 3. 制度条款 4. 产品型号 5. 人名 6. 缩写 7. 精确字段例如用户问:
SOP-2026-IT-017 的发布审批流程是什么?向量检索可能召回“发布流程概述”,但漏掉真正的:
SOP-2026-IT-017再比如用户问:
销售客户拜访二线城市住宿费是多少?向量检索可能召回“普通差旅制度”,因为语义上也很接近。
这类问题说明: