news 2026/5/23 18:24:47

从提示词工程到上下文工程:Google白皮书深度解析AI Agent记忆架构设计!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
从提示词工程到上下文工程:Google白皮书深度解析AI Agent记忆架构设计!

简介

Google发布《Context Engineering》白皮书,宣告AI开发进入上下文工程时代。Context Engineering通过Session和Memory双脑机制,使大模型从无状态变为有状态。Session管理短期对话上下文,Memory负责长期知识存储,二者共同实现Agent的跨会话理解和个性化。生产环境需注意异步生成、用户隔离和防止记忆投毒。未来AI竞争将取决于Context Engineering的精细程度。


11月,Google 发布了一份重磅白皮书《Context Engineering: Sessions, Memory》,正式宣告 AI 开发从“Prompt Engineering”----提示词工程时代跨入“Context Engineering”—上下文工程时代。

如果说 Prompt Engineering 是提示 AI怎么说话,那么 Context Engineering 就是赋予 AI长期记忆****和个性化灵魂

今天,我们就来深度拆解这份白皮书,看看 Google 是如何设计企业级 Agent 记忆架构的。

先来看一个问题,为什么所有 AI Agent 都逃不过“上下文工程”?

我们知道,大模型天生是无状态的。每次调用,模型就是一张白纸:不记得你是谁,不记得你刚刚说过什么,不记得任务进度,不会形成知识沉淀,更不会“跨会话理解你”。

但一个真正能工作的 AI Agent,需要连续对话,需要理解任务上下文、记住用户偏好,需要形成长期知识,需要存工具调用状态,能复用过往经验。

这就是Context Engineering(上下文工程)出现的理由。 白皮书明确提出:

LLM从“无状态”变成“有状态”不是模型问题,而是工程问题。

那么, 什么是 Context Engineering?

Google 在白皮书中提出了一个比喻:Context Engineering 就像是大厨烹饪前的“备料”

过去我们做开发,往往只关注 Prompt----就像是菜谱,告诉模型要做什么。

而**Context 就像是配料----**只要你把最优质的食材(用户画像、历史记忆、当前任务状态)清洗、切好、摆在模型面前,即使是一个普通厨师也能做出一道好菜。

**Context Engineering 的核心定义是:**动态地组装和管理信息。它不仅仅是拼接字符串,而是根据当前的用户、对话历史和外部数据,策略性地选择、压缩和注入信息,最大化相关性,最小化噪声

Context Engineering的生命周期

解释一下这张图。

Fetch Context----获取上下文:Agent 首先检索上下文——例如用户记忆、RAG 文档和最近的对话事件。对于动态上下文检索,Agent 会利用用户的查询和其他元数据来识别需要检索哪些信息。

Prepare Context----准备上下文:Agent 框架动态构建用于 LLM 调用的完整提示词。虽然单独的 API 调用可能是异步的,但“准备上下文”是一个阻塞的、“热路径”过程。在上下文准备好之前,Agent 无法继续下一步。

InvokeLLMand Tools----调用 LLM 和工具:Agent 迭代地调用 LLM 和任何必要的工具,直到生成给用户的最终响应。工具和模型的输出会被追加到上下文中。

Upload Context----上传上下文:在本轮对话中收集到的新信息会被上传到持久化存储中。这通常是一个“后台”过程,允许 Agent 在异步进行记忆整合或其他后处理时,先完成当前的执行任务。

Context Engineering的核心架构:Session 与 Memory 的“双脑”机制

很多开发者容易混淆会话历史和记忆。Google 明确将它们划分为两个截然不同的系统:Session 和 Memory。

Session:你的临时工作台----即时上下文

Session 是短期的、易逝的,是“正在发生的一切”,包括当前轮对话内容,工具调用与结果,Agent 中间步骤,推理链路,当前任务进度等等。随着对话变长,Token 成本激增,模型注意力变分散,响应变慢。

Google 的解法是用压缩策略。不把整个 Session 喂给模型,而是使用滑动窗口----只看最近 N 轮对话,或用递归摘要----把旧对话总结成一段话。

Memory:长期知识

Memory 是长期的、整理过的知识,它是从 Session 中提取清洗后的高价值信息。

很关键的一点:Session 是为了保证对话的连贯性,而 Memory 是为了实现跨会话的个性化

Memory 的难点不在存储,而在“抽取与整合”

一个可用的 Memory pipeline,需要完成三件事:

**先Extraction----抽取,**从 Session 里提炼关键点,包括用户偏好,用户事实,任务状态,agent 经验,可重复利用的信息等等,是选择性提取,不是全量复制。

**再Consolidation----整合,**包括:去重,合并,冲突解决,分级,记忆衰减等等,这是 Memory 管线最复杂的部分。

**再Storage----存储,**可以是文本,JSON,Vector,Key-value,Graph。

下面这张图便是Memory抽取、整合、存储的pipeline。

Memory vs RAG:两个完全不同的概念被混为一谈了太久

很多人以为 RAG 就是Memory,其实不然。白皮书直接给出了行业最清晰的区分。

这份白皮书给出了一个非常形象的对比:

RAG 是“图书馆理员” ,它守着一座巨大的图书馆----企业文档、Wiki,它的知识是静态的事实性的,它让 Agent 成为领域专家

而Memory 是“私人助理” ,它拿着一个小本本,跟在用户身后,记录用户的喜好、习惯和过去的对话。它的知识是动态的私密的。它让 Agent 成为懂你的专家

用一张图来展示AgentMemorySessionExternal Knowledge(外部知识库/RAG)之间的信息流转关系。它是 Context Engineering 核心逻辑的完美可视化。

生产环境落地的“生死线”

在 Demo 里跑通 Memory 很简单,但在生产环境中,这份白皮书中强调了几个绝对不能踩的坑:

Memory 必须是“异步生成”----记忆的生成----Extraction & Consolidation,非常消耗算力和时间。不要让用户等, 这部分工作必须在后台异步进行。用户说完话,Agent 立刻回复,记忆在后台慢慢生成。

**需要做好用户隔离----**Memory 存储的是用户隐私。必须在架构上实现严格的用户隔离。A 用户的记忆绝对不能被 B 用户的 Agent 检索到。这不仅是 Bug,更是安全事故。

**防止记忆投毒----**小心恶意用户!如果用户故意说“我的密码是 123456”或者输入错误的指令试图误导 Agent,系统必须有类似Model Armor的层级来清洗和验证写入的数据。

未来的 AI 竞争,不再仅仅是比拼谁的模型参数更大,而是比拼谁的 Context Engineering 做得更细致。只有当 Agent 拥有了连贯的 Session 管理和深度的 Memory 系统,它才能从一个“只懂回答问题的机器”,进化成一个“真正懂你的伙伴”。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求:大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能,学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力:大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/18 23:51:39

WINBOND华邦 W25Q256JVFIQ/烧录 SOP16 NOR FLASH

2.特性 新一代SpiFlash存储器系列-W25Q256JV:256兆位/32兆字节标准SPI:CLK、ICS、DI、DO 双SPI:CLK、/CS、100、101, 四通道SPI:CLK、/CS、I/00、I/01、I/02、I/033字节或4字节寻址模式 软件与硬件复位(1) 最高性能串行闪存 133MHz标准/双通道/四通道SPI时钟 -266/532MHz等效双…

作者头像 李华
网站建设 2026/5/23 8:34:48

文档转换工具终极指南:从零基础到高效应用

文档转换工具终极指南:从零基础到高效应用 【免费下载链接】pandoc Universal markup converter 项目地址: https://gitcode.com/gh_mirrors/pa/pandoc 文档转换是每个内容创作者和办公人员都会面临的日常需求。无论你是学生需要将论文转换为不同格式&#x…

作者头像 李华
网站建设 2026/5/22 20:53:51

快速获取 Red Hat Enterprise Linux 7.0 镜像 ISO 的完整指南

快速获取 Red Hat Enterprise Linux 7.0 镜像 ISO 的完整指南 【免费下载链接】RedHatEnterpriseLinux7.0镜像ISO下载指南 本仓库提供 Red Hat Enterprise Linux 7.0 镜像 ISO 文件的下载链接,方便用户快速获取并安装该操作系统。该镜像文件存储在百度网盘中&#x…

作者头像 李华
网站建设 2026/5/12 11:06:08

Qwen3-4B-Thinking-2507-FP8:轻量化模型重塑AI推理技术格局

Qwen3-4B-Thinking-2507-FP8:轻量化模型重塑AI推理技术格局 【免费下载链接】Qwen3-4B-Thinking-2507-FP8 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-4B-Thinking-2507-FP8 在人工智能技术快速演进的当下,轻量化模型正成为推动产…

作者头像 李华
网站建设 2026/5/23 17:32:05

教你使用服务器打造“隐蔽背单词”学习环境:ToastFish 通知栏背词工具

很多人背单词失败,并不是因为不想学,而是因为现实太碎: 上班上课很忙,抽不出完整的 30 分钟 打开背词 APP 又容易分心(刷着刷着就跑偏了) 公开背单词有点尴尬,尤其在办公室或课堂 记忆需要重复,但你总是忘记“复习这件事” 真正有效的学习往往不是“拼命学一小时”…

作者头像 李华