news 2026/5/4 11:37:47

yyds!给大模型装上记忆系统,让AI不再“金鱼记忆“,小白也能秒变Agent架构师!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
yyds!给大模型装上记忆系统,让AI不再“金鱼记忆“,小白也能秒变Agent架构师!

本质上,目前的LLM只是一个无状态的函数。输入,计算,输出,结束。每一次交互,对它来说都是初见。

要让工具进化为Agent,必须引入状态。这个状态,就是记忆。没有记忆,智能就无法在时间维度上积累;没有积累,就没有复利。

构建记忆系统,就是赋予AI在时间长河中航行的能力。

一、记忆的本质

在计算机科学里,记忆就是状态管理。LLM天生无状态。为了延续,必须外挂存储。

我们通常把这个外挂分为两类:

  1. 短期记忆:像内存,快,贵,存当下。
  2. 长期记忆:像硬盘,慢,廉,存历史。

二、短期记忆

短期记忆,即 Prompt 中的 Context(上下文)。是 Agent 当前的工作台,摆着正在处理的任务,和刚说的话。

容量限制

强如GPT-4,上下文窗口也有极限(如128k token)。更要命的是成本和延迟。

对话越长,烧的钱越多,反应越慢。人不能把一辈子的事都塞进大脑前额叶,AI也一样。

优化策略

我们需要对短期记忆进行治理,核心在于压缩与丢弃。

短期记忆优化策略

滑动窗口

只保留最近的N轮对话,旧的直接扔掉。

简单,可控。但健忘,容易丢掉早期的关键信息。

摘要压缩

当对话超出阈值,触发后台任务,让LLM对历史进行摘要。 将 你好,我叫小明,我是一名程序员… 压缩为 用户是小明,职业程序员。

省空间,留核心。但细节丢了,计算成本也上去了。

三、长期记忆

如果短期记忆是工作台,长期记忆就是无限扩容的图书馆。当用户问起上个月讨论的架构方案,滑动窗口早就把它丢了,这时候,需要去图书馆里翻书。

向量数据库

长期记忆的载体,不是MySQL,而是向量数据库 (Vector DB)。人类的记忆是模糊的、关联的。你记不住一句话的ASCII码,但你能记住它的语义

Vector DB通过Embedding技术,将文本转化为高维向量。在这个高维空间里,苹果和水果离得很近,但苹果和汽车就离得很远。

AI记忆系统架构图

RAG机制

RAG(Retrieval Augmented Generation)是长对话的解决方案。

RAG流程图

当用户Query到来时:

  • 感知:将Query转化为向量。
  • 检索:在向量库中寻找距离最近的Top-K片段。
  • 增强:将这些片段作为参考资料塞进Prompt。
  • 生成:LLM基于参考资料回答。

这解决了记忆容量问题,也缓解了幻觉问题。

四、架构融合

孤立的短期或长期记忆都不够完善,智能,在于两者的流动。

记忆巩固

人睡觉时,会将短期记忆固化为长期记忆,Agent 也需要这个过程。

记忆巩固流程图

交互时,全靠短期记忆抗。会话结束了,就提取关键信息。接着入库,把信息向量化,存进长期记忆。下次唤醒,先查库,构建好上下文,再开口。

五、写在最后

记忆不是存储,而是选择。遗忘和记住同样重要。如果记住了所有噪音,就听不见信号。

过滤掉平庸的日常,留下有价值的数据。这才是 Agent 的核心。

那么,如何系统的去学习大模型LLM?

作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/2 9:04:46

Z-Image-Edit与DragGAN对比:两种编辑范式的差异

Z-Image-Edit与DragGAN对比:两种编辑范式的差异 在图像AI技术飞速演进的今天,我们正经历一场从“操作工具”到“表达意图”的创作革命。过去,修改一张照片需要熟练掌握Photoshop中的图层、蒙版和变形工具;如今,只需说一…

作者头像 李华
网站建设 2026/5/1 4:13:26

事务管理最全指南:嵌套事务、传播机制与失效场景深度复盘

🚀 前言:为什么事务管理如此重要? 在现代企业级应用开发中,数据一致性是系统的生命线。想象一个电商场景:用户下单购买商品,系统需要同时完成以下操作: 🛒 扣减库存:商…

作者头像 李华
网站建设 2026/5/1 4:43:54

找不到工作就好好学一下这份16W字Java面试合集

倒霉的时候总会想起福祸相依,但你会发现倒霉起来没完没了,就是看不到传说中的“福”年初被裁了,我会安慰自己,此处不留爷自有留爷处,然后踏入找工作的行列;没有面试邀请,我会告诉自己&#xff0…

作者头像 李华
网站建设 2026/5/2 7:04:03

多模态大模型实战:从零构建电商商品理解系统

摘要:本文深度解析多模态大模型在电商场景中的落地实践。基于Qwen-VL-Chat架构,构建覆盖图文理解、属性提取、违规检测的端到端系统。通过自定义视觉token融合策略与动态分辨率适配技术,在A100上单卡实现batch size32的推理,QPS提…

作者头像 李华
网站建设 2026/5/1 4:55:39

Photoshop AVIF插件全面解析:开启图像压缩新纪元

Photoshop AVIF插件全面解析:开启图像压缩新纪元 【免费下载链接】avif-format An AV1 Image (AVIF) file format plug-in for Adobe Photoshop 项目地址: https://gitcode.com/gh_mirrors/avi/avif-format 想要让Photoshop图像优化达到新的高度吗&#xff1…

作者头像 李华
网站建设 2026/5/1 6:51:55

测试找BUG总结

测试找BUG总结 1、对业务模块的理解要全面、深刻。 即:对此次新功能或者功能改进相关的业务要理解透彻。 好处: 1)对此次需求的合理与否可做出判断。 2)对相关联的其他测试点需进行测试,以防之前的相关功能失效或…

作者头像 李华