news 2026/5/1 10:20:06

解释一下RAG中的Rerank

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
解释一下RAG中的Rerank

Rerank其实一个是对初步检索返回的候选文档列表再次进行排序的过程。

如果把RAG的检索过程类比成公司的招聘过程,则有如下对应关系:

1.初步检索(Retrieval)
这一步就类似于HR筛选简历,找工作的人往往很多,HR每天都可能收到上万份甚至几万份简历。

假设有1万份简历,1个HR每天工作8小时,那么1小时之内就得看完1250份,平均到1分钟以内就得看完20多份,这几乎是不可能的。

所以,不可能每份简历HR都会细看。

那她会怎么看呢,主要就是看关键词,比如Java、 大模型等等,看到简历上有这些匹配的关键词字眼 ,就筛选出来。

这样做就会导致看似简历已经匹配上关键词了,但是候选人的能力可能还不太符合要求,只能选出前100个看似还行的候选人。

我们把这个场景对应到RAG的检索过程里面就是,向量检索,它虽然算得快,但是对语义的理解还差点意思。

2.重排序(Rerank)

这个过程就类似于企业招聘过程的业务面试,也就是主管把这100人的简历打印出来仔细阅读,如果觉得候选人的过往经历和工作经验很符合要求,就会约下一步的一对一业务面试。

这个过程花费的时间比较长,消耗的精力也更多,但是筛选出来的候选人也更符合要求。

这也就是RAG检索过程的Rerank,可以精准地判断初步检索返回的文档是不是真正能够回答用户的问题,最后再喂给大模型去生成一个答案。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 6:28:30

深度学习毕设选题推荐:基于MobileNet v2模型的口罩实时检测系统实现

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/5/1 6:28:20

ROS2十年演进(2015–2025)

ROS2十年演进&#xff08;2015–2025&#xff09; 一句话总论&#xff1a; ROS2从2015年概念提出、2017年Alpha版起步&#xff0c;本想解决ROS1实时性差、分布式弱、安全性无的问题&#xff0c;却在2025年彻底凉凉——全球新机器人项目份额<1%&#xff0c;在中国市场<0.5…

作者头像 李华
网站建设 2026/5/1 6:18:06

末端执行器十年演进(2015–2025)

末端执行器十年演进&#xff08;2015–2025&#xff09; 一句话总论&#xff1a; 2015年末端执行器还是“刚性二指/三指夹爪气动/伺服驱动固定抓取模式”的工业工具&#xff0c;2025年已进化成“多指灵巧手全电驱力控<0.1N端到端VLA大模型意图直驱自适应变形/吸盘融合量子鲁…

作者头像 李华
网站建设 2026/5/1 6:26:53

springboot基于Java的旅游攻略分享平台设计实现

背景分析随着旅游业的快速发展&#xff0c;个性化旅游需求日益增长&#xff0c;传统攻略平台存在信息分散、互动性差等问题。基于SpringBoot的旅游攻略分享平台整合用户生成内容&#xff08;UGC&#xff09;&#xff0c;通过技术手段解决信息碎片化&#xff0c;提升用户体验。技…

作者头像 李华
网站建设 2026/4/30 23:01:23

学术论文降重技巧盘点:6种AI辅助方法全解析

写论文查重技巧排名&#xff1a;6大AI方法合集推荐 排名 工具/方法 核心优势 适用场景 1 aibiye 智能降重学术语言优化 初稿完成后深度润色 2 aicheck 多维度查重选题辅助 全程论文质量监控 3 秒篇 一键生成逻辑结构优化 紧急补论文初稿 4 AskPaper 文献解析…

作者头像 李华