利用Agent 基础、ReAct、planning、memory做tool-based agent，利用 JSON Schema做structured output extraction从从文本提取-编程实验室

一、整体系统架构

┌──────────────────┐
│ User │
└────────┬─────────┘
│
▼
┌─────────────────┐
│ Agent │
│ ReAct + Planner │
└────────┬────────┘
│
┌───────────────┼────────────────┐
│ │ │
▼ ▼ ▼
┌────────────┐ ┌────────────┐ ┌────────────┐
│Order Tool │ │Search Tool │ │SQL Tool │
└────────────┘ └────────────┘ └────────────┘
│
▼
┌───────────────────┐
│ Structured Output │
│ JSON Schema │
└───────────────────┘
│
▼
┌──────────────┐
│ Memory │
│ short / long │
└──────────────┘

二、核心概念

Agent 本质：

LLM + 推理 + 工具调用 + 状态

普通 ChatGPT：

输入 → 输出

Agent：

输入 ↓ 思考 ↓ 决定是否调用工具 ↓ 获得结果 ↓ 继续思考 ↓ 最终回答

三、ReAct 是 Agent 的核心

ReAct =

Reasoning + Acting

Agent 会：

Thought: 我要提取订单信息 Action: 调用 extraction_tool Observation: 得到结构化订单 Thought: 订单缺少电话 Action: 继续询问用户

流程：

用户消息 ↓ Thought（思考） ↓ Action（调用工具） ↓ Observation（观察结果） ↓ 继续推理

四、Planning（规划）

复杂任务时：

Agent 会拆任务。

例如：

“帮我处理客户订单并保存数据库”

Agent 会：

1. 提取订单信息 2. 验证字段 3. 查询库存 4. 写入数据库 5. 返回结果

这就是 Planning。

五、Memory（记忆）

1. Short-term memory

当前对话历史。

例如：

chat_history = [ {"role": "user", "content": "..."}, {"role": "assistant", "content": "..."} ]

作用：

多轮对话
上下文理解

2. Long-term memory

长期记忆。

例如：

用户常用地址 用户公司 用户购买偏好

通常存：

Vector DB
Redis
PostgreSQL

六、Tool-based Agent

核心思想：

Agent 自动选择工具。

例如：

用户： 帮我提取订单

Agent：

选择 extraction tool

为什么需要 JSON Schema

LLM 输出不稳定：

可能返回： - 自然语言 - 漏字段 - 格式错误

JSON Schema 用于：

强制AI返回固定结构

七、订单文本示例

用户输入：

你好，我想购买： 2 台 iPhone 15 Pro 1 台 MacBook Air 收货人：张三 电话：13800138000 地址：北京市朝阳区xx路88号

我们希望 AI 输出：

{ "customer_name": "张三", "phone": "13800138000", "address": "北京市朝阳区xx路88号", "items": [ { "product": "iPhone 15 Pro", "quantity": 2 }, { "product": "MacBook Air", "quantity": 1 } ] }

十、JSON Schema

这里是关键。

order_schema = { "type": "object", "properties": { "customer_name": { "type": "string" }, "phone": { "type": "string" }, "address": { "type": "string" }, "items": { "type": "array", "items": { "type": "object", "properties": { "product": { "type": "string" }, "quantity": { "type": "integer" } }, "required": ["product", "quantity"] } } }, "required": [ "customer_name", "phone", "address", "items" ] }

八、项目结构

requirements.txt

openai>=1.30.0 pydantic>=2.0.0 python-dotenv>=1.0.0

安装依赖

在项目目录运行：

pip install -r requirements.txt

.env

OPENAI_API_KEY=你的_openai_api_key

schemas.py

from pydantic import BaseModel from typing import List class Item(BaseModel): product: str quantity: int class Order(BaseModel): customer_name: str phone: str address: str items: List[Item]

memory.py

class Memory: def __init__(self): self.history = [] def add(self, role, content): self.history.append({ "role": role, "content": content }) def get_history(self): return self.history

tools.py

import os import json from dotenv import load_dotenv from openai import OpenAI from schemas import Order load_dotenv() client = OpenAI( api_key=os.getenv("OPENAI_API_KEY") ) def extract_order_info(text: str): response = client.chat.completions.create( model="gpt-4.1-mini", messages=[ { "role": "system", "content": "你是订单信息提取助手" }, { "role": "user", "content": f""" 从下面文本提取订单信息： {text} 如果缺失字段，返回空字符串。 """ } ], response_format={ "type": "json_schema", "json_schema": { "name": "order_schema", "schema": Order.model_json_schema() } } ) result = response.choices[0].message.content return json.loads(result)

main.py

from tools import extract_order_info from memory import Memory memory = Memory() print("Agent 已启动（输入 quit 退出）") while True: user_input = input("\n用户：") if user_input.lower() == "quit": break memory.add("user", user_input) print("\n[Thought]") print("我需要提取订单信息") print("\n[Action]") print("调用 extract_order_info tool") result = extract_order_info(user_input) print("\n[Observation]") print(result) memory.add("assistant", str(result))

运行方式

进入目录：

cd agent_project

激活 venv：

.venv\Scripts\activate

安装：

pip install -r requirements.txt

运行：

python main.py

测试输入

输入：

我要买2台iPhone 15 Pro 1台MacBook Air 收货人：张三 电话：13800138000 地址：北京市朝阳区88号

输出

{ "customer_name": "张三", "phone": "13800138000", "address": "北京市朝阳区88号", "items": [ { "product": "iPhone 15 Pro", "quantity": 2 }, { "product": "MacBook Air", "quantity": 1 } ] }

项目完成