ReAct是Google团队提出的智能体交互范式,通过"推理-行动-观察"循环迭代解决复杂任务,结合纯推理与纯行动模式的优势,避免大模型"幻觉"问题。文章详细解析了ReAct的五大核心组件架构和四阶段执行流程(Thought→Action→Observation→终止判定),并提供了标准化格式规范和实际应用案例,帮助开发者构建高效可靠的大模型智能体系统。
一、ReAct 的核心定义与设计理念
ReAct 解决的核心问题:传统大模型仅靠内部推理易出现 “幻觉”(脱离事实),纯行动型智能体则缺乏规划性;ReAct 结合两者优势,让智能体:
- 推理:基于任务和已有信息,思考 “下一步该做什么”“为什么这么做”;
- 行动:执行具体操作(如调用工具、查询知识库、访问外部 API)获取新信息;
- 循环迭代:用行动结果更新认知,再推理下一步,直到任务完成。
其核心公式可概括为:
思考(Reason)→ 行动(Act)→ 观察(Observe)→ 再思考 → 再行动...
二、ReAct 执行框架的核心架构
ReAct 框架由 5 个核心组件构成,组件间通过 “上下文状态” 串联,形成闭环:
| 组件 | 核心职责 |
|---|---|
| 任务输入模块 | 接收用户原始任务(如 “查询 2025 年人工智能顶会 ICML 的举办时间和地点”),标准化任务描述 |
| 推理引擎(Reasoner) | 核心组件,基于 “任务 + 历史上下文 + 观察结果”,输出「思考(Thought)」和「行动指令(Action)」 |
| 行动执行器(Actor) | 解析推理引擎输出的行动指令,调用外部工具 / 接口(如搜索引擎、数据库、API),执行具体操作 |
| 观察模块(Observer) | 捕获行动执行结果(工具返回的信息、操作成功 / 失败状态),标准化为 “观察结果(Observation)” |
| 上下文管理器 | 存储任务全生命周期的信息:原始任务、每一轮的 Thought/Action/Observation、当前任务状态(未完成 / 完成 / 失败) |
| 终止判定模块 | 基于上下文判断任务是否完成,若完成则输出最终结果;未完成则触发下一轮 “推理 - 行动 - 观察” |
三、ReAct 执行框架的阶段拆解(逐轮迭代逻辑)
ReAct 的核心是 “多轮迭代”,每一轮迭代包含4 个核心阶段,直到终止条件触发。以下是单轮完整流程 + 多轮迭代的逻辑链:
阶段 1:初始化与首轮推理(Thought)
- 输入:原始任务 + 空上下文(首轮无历史信息);
- 核心行为:推理引擎完成 3 件事:
- 分析任务目标,明确 “当前缺少什么信息”;
- 评估 “下一步能做什么”(可选行动:调用工具 / 直接回答 / 重试);
- 给出 “为什么选择该行动” 的理由(避免无目的行动);
输出格式(标准化):
Thought: [对任务的分析+下一步行动的理由]
阶段 2:行动执行(Action)
- 输入:推理引擎输出的 “行动指令”;
- 核心行为:
- 行动执行器解析指令,匹配预设的工具集(如
Search/Calculate/DatabaseQuery); - 调用对应工具,传递参数(如
Search: 2025 ICML举办时间和地点); - 捕获工具执行状态(成功 / 失败,如 “搜索超时”“返回结果为空”);
输出格式(标准化):
Action: [ToolName: Param1, Param2,...](工具名需提前定义,参数需符合工具调用规范)
阶段 3:结果观察(Observation)
- 输入:行动执行器的输出(工具返回结果 / 执行状态);
- 核心行为:
- 观察模块清洗 / 标准化结果(如将网页文本提取为关键信息、将错误状态转为可读描述);
- 把结果写入上下文管理器,更新任务状态;
输出格式(标准化):
Observation: [工具返回的关键信息/执行状态描述]
阶段 4:终止判定与迭代
- 输入:更新后的上下文(含本轮 Thought/Action/Observation + 历史信息);
- 核心行为:
- 终止判定模块校验 “是否满足完成条件”(如 “信息足够回答任务”“行动失败且无法重试”);
- 若满足终止条件:输出最终结果;
- 若未满足:回到「阶段 1」,推理引擎基于新上下文生成下一轮 Thought;
- 终止条件示例:
- 正向终止:获取到任务所需的全部信息;
- 反向终止:多次行动失败(如搜索 3 次均无结果)、任务本身无法完成(如 “查询 2025 年世界杯举办地”,实际 2025 年无世界杯)。
四、ReAct 框架的格式规范(核心约束)
ReAct 的落地依赖严格的格式约束(避免大模型输出混乱),主流的标准化格式模板如下(以大模型应用为例):
# 任务{用户原始任务}# 迭代轮次 N Thought:{本轮推理:分析当前信息、下一步行动的理由}Action:{ToolName:参数1,参数2}Observation:{行动执行后的结果/状态}# 迭代轮次 N+1Thought:{基于上一轮观察结果的新推理}Action:{新的工具调用指令}Observation:{新的行动结果}...# 终止 Final Answer:{任务的最终答案}五、多轮迭代的典型示例(落地场景)
以 “查询 2025 年 ICML 举办时间 + 地点,并对比 2024 年数据” 为例,完整执行流程:
# 任务 查询2025年ICML举办时间和地点,并对比2024年的举办信息 # 轮次1Thought:我需要先获取2025年ICML的举办信息,当前无相关数据,应调用搜索引擎查询。 Action:Search:2025ICML 举办时间 地点 Observation:2025年ICML(国际机器学习大会)将于2025年7月21日-27日在日本东京举办。 # 轮次2Thought:已获取2025年ICML信息,还需2024年数据才能对比,继续调用搜索引擎查询2024年ICML举办信息。 Action:Search:2024ICML 举办时间 地点 Observation:2024年ICML于2024年7月21日-27日在奥地利维也纳举办。 # 轮次3Thought:已获取2025和2024年的全部信息,满足任务要求,可终止并输出对比结果。 Action:Finish:无需调用工具,直接输出结果 Observation:任务信息完整 # 终止 Final Answer:2025年ICML将于7月21日-27日在日本东京举办,2024年ICML于7月21日-27日在奥地利维也纳举办;两者举办时间一致,举办地点分别为东京和维也纳。六、ReAct 执行框架的关键设计要点
- 工具集的封装规范
- 需提前定义工具的 “名称 - 参数 - 返回格式”(如
Search: 关键词、Calculate: 数学表达式),避免行动执行器解析失败; - 工具需包含容错逻辑(如超时重试、参数校验),观察模块需能识别 “工具调用失败” 并反馈给推理引擎。
- 上下文的管理策略
- 上下文需 “轻量化”:仅保留关键信息(避免大模型上下文窗口溢出),如只存储每轮的核心 Thought 和有效 Observation;
- 上下文需 “可追溯”:记录每轮迭代的时间、行动类型,便于调试(如定位 “哪一轮搜索返回了错误信息”)。
- 终止条件的精细化设计
- 避免 “无限迭代”:设置最大迭代次数(如最多 5 轮),超过则判定任务失败;
- 避免 “提前终止”:需明确 “信息足够” 的判定规则(如 “问答任务需包含所有查询维度的信息”)。
- 推理引擎的提示工程
- 需在提示词中明确 ReAct 的格式要求(如 “必须按照 Thought→Action→Observation 的格式输出”);
- 需引导推理引擎 “优先思考,再行动”,避免直接跳过推理阶段执行操作。
那么,如何系统的去学习大模型LLM?
作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
为什么要学习大模型?
我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。
👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!