news 2026/5/21 13:07:13

AI·Agent 的记忆革命:从“记不住“到“懂遗忘“

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI·Agent 的记忆革命:从“记不住“到“懂遗忘“
文章信息:
预计字数:2800 字 阅读时间:9 分钟 难度等级:⭐⭐(小白友好,无需技术基础)
核心价值:理解AI记忆系统的核心设计理念,看懂"懂遗忘"为什么比"记得多"更重要

你有没有发现,大多数AI助手都有一个让人抓狂的毛病:

记不住。

你昨天告诉它的偏好,今天它就忘了。

你上周反复强调的规则,这周它又犯了。

你花了半小时调教出来的"完美搭档",关掉对话框那一刻,一切归零。

就像《海底总动员》里的多莉,只有7秒记忆。

坦白说,这个问题困扰了我很久。我每天和AI工作10+个小时,一个人+AI就是我的整个团队。

如果AI连我上周说过什么都记不住,那它跟一个每天失忆的实习生有什么区别?

后来我想明白了一件事。

问题不是AI"记不住",反而是AI"不会忘"。


一、为什么"不会忘"反而更糟?

听起来有点反直觉,但你想想看:

如果一个人的大脑什么都不遗忘,会发生什么?

心理学上有个真实的案例,叫所罗门·舍雷舍夫斯基。

他能记住一切:看到的每个数字、听到的每个单词、经历的每个瞬间。听起来像是超能力?

不是的。

他的大脑被无用的细节塞满了。

他无法抽象思考,无法归纳总结,甚至连理解一句话的意思都困难。

因为他脑子里有太多"噪音",真正重要的信号被淹没了。

大多数AI的记忆系统,也是这个毛病。

什么都记。"好的"、"ok"、"👍"、"/status"、"哈哈哈"......

这些东西全部存下来,日积月累,记忆库里全是垃圾。

真正有价值的信息呢?反而找不到了。

问题链: 记住一切 → 细节塞满 → 无法抽象思考 → 信号被噪音淹没 → 信息瘫痪

这就像一个从不整理的书架:

新书不断扔进去,旧书永远不清理,最后想找一本书时,满眼都是书,却找不到你要的那本。

🎯 核心洞察:

  • 记忆过载 = 信息瘫痪
  • 遗忘不是缺陷,是必要的智能
  • 所罗门的悲剧是AI的警示

1.1 第一性原理:记忆的本质是什么?

做这套系统之前,我没有去看别人家的AI记忆怎么做的。

我问了自己一个问题:

如果从零开始设计,记忆的本质应该是什么?

乔布斯说过一句话,大意是:

极简不是什么都没有,是砍到只剩本质。如果你只能保留一个功能,保留哪个?

1.2 对记忆系统来说,答案很清楚:

不是"记得多",是"记得准"。

记忆系统也是一样。不是所有记忆都值得保留。

学会"说不",学会"遗忘",才是记忆管理的第一性原理。

1.3三层记忆:像人脑一样分层

搞清楚问题之后,我开始自己动手做一套记忆系统。

花了不少时间,折腾了好几个版本。现在跑在我的AI助手Hermes Agent上的,是一个三级的蒸馏架构:

  • L1,会话摘要。
    • 每次对话结束,自动提炼出3到5个关键要点。不是把所有聊天记录一股脑存下来,而是像你开完会写会议纪要一样,只记结论。
  • L2,结构化知识。
    • 当某个主题积累了足够多的L1记录,系统会自动"蒸馏"出可复用的知识。比如"Gateway故障排查"这个主题,10条L1摘要提炼成1条结构化的L2知识,包含核心规则、工作流、踩坑案例。
  • L3,核心洞察。
    • 最高层。从所有知识中提炼出来的、跨领域通用的底层认知。比如"调研失败时不编造,直接告诉用户"这种原则性的洞察。

说到底,这跟人脑的运作方式很像:

  • 你不会记住今天早饭吃了什么(L1,14天半衰期)
  • 但你会记住"我不喜欢吃香菜"(L2,180天半衰期)
  • 更会记住"做人要诚实"(L3,365天半衰期)。

不同类型的记忆,有不同的"保质期"。


二、核心设计:衰减与遗忘

这套系统最核心的技术,是一个叫Weibull衰减的函数:

score = exp(-(age_days / half_life) ^ 1.5)

翻译成人话:

一条记忆的"分数"会随时间下降,但下降的速度取决于它的"半衰期"。

不同类型的记忆,半衰期完全不同:

记忆类型半衰期举例
日常事件14天今天调了个配置
案例教训30天踩过的坑
工作模式120天项目偏好、工作习惯
核心洞察365天底层原则、价值观

PS:还有一个细节:经常被查询的记忆,衰减速度会变慢,最多可以慢3倍。

就像你反复用的技能会越练越熟,不用的技能会慢慢生疏。这不就是人脑的工作方式吗?

三、噪音过滤:先过滤,再存储

除了"会忘",另一个关键设计是"会过滤"。

说实话,我翻了一下之前的记忆数据,垃圾内容的占比高达40%。"好的"、"ok"、"👍"、"/help"、单字回复......

这些全部被存下来了。

40%的存储空间,被无意义的内容占着。

所以我在写入环节加了过滤器,自动过滤6类噪音:

  • 肯定回复:"ok"、"好的"、"可以"
  • 表情符号:"👍"、"😊"
  • 系统命令:"!help"、"/status"
  • 单字回复:长度小于3个字符
  • 否定回复:"不"、"不行"
  • 重复短语:"哈哈哈"

过滤完之后?

记忆库体积减少40%,检索速度提升60%。


四、自适应检索:不是每次都需要翻记忆

还有一个反直觉的设计:不是每次对话都需要检索记忆。

"你好"、"hi"这种问候语,不需要检索。

"帮我写个文章"这种通用指令,不需要检索。

只有出现"我之前说过"、"记得"、"历史"这类关键词时,系统才会启动记忆检索。

这样一来,检索效率提升了60%,而且不会在无关对话中浪费计算资源。

时间版本管理:历史比删除更有价值

大多数系统更新配置时,会直接覆盖旧值。我不这么做。

我的系统会给每条记忆标记"生效时间"和"失效时间"。比如:

3月1日: Gateway端口18790(失效于3月15日) 3月15日: Gateway端口18789(替代3月1日版本)

旧记忆不删除,只是标记为"已过期"。

好处是什么?

可以追溯完整的配置演变历史。

出了问题时,你能看到"变之前是什么样的,什么时候变的,变成了什么"。

这在排查故障时极其有用。


五、四个"会",一个"懂"

总结一下这套系统的核心理念:

  • 会过滤:写入前先判断,噪音不进库。不是什么都记。
  • 会检索:自适应判断是否需要检索。"你好"跳过,"我之前说过"才检索。
  • 会遗忘:不同记忆有不同保质期。不重要的自然淡出,重要的持续保留。
  • 会蒸馏:当一个主题积累了足够多的碎片记忆,自动提炼成可复用的知识体系。不是记住10个案例,而是提炼出1条规律。

四个"会",最终指向一个"懂":懂遗忘。

"你一生只需要做对很少的事,只要别做太多错的事。"

记忆系统也是:不需要记住所有事,只需要记住对的事。

六、现在跑得怎么样?

说实话,跑了几个月,数据是这样的:

  • L1(会话摘要):34条
  • L2(结构化知识):55条,9个分类
  • L3(核心洞察):10条
  • 覆盖31个会话

不多。但每一条都是有效的。

我宁愿要55条真正有用的知识,也不要550条垃圾堆。

说实话,这套系统还不完美。有些地方的自动化还不够,偶尔需要手动维护。

但方向是对的:

从"什么都记"到"懂得什么该忘"。


七、技术实现

如果你不是专业的技术同学,可能会好奇这东西具体怎么实现的。

简单说一下核心技术栈:

## 存储: SQLite三层表(memory_l1 / memory_l2 / memory_l3) 外加一个分支表(memory_branches)做时间版本管理。 ## 缓存: 三级缓存架构。 1. L1用LRU缓存(容量100条) 2. L2用查询结果缓存(TTL 300秒) 3. L3全量加载到内存。 4. 蒸馏管道: L0(原始会话)→ L1(摘要提取)→ L2(知识蒸馏,需调用LLM提炼)→ L3(洞察聚合,需LLM聚合)。 每一级都是自动触发,有明确的升级门槛。 ## 同步: 三级记忆全部自动同步到Obsidian知识库。 路径分别是: 1. L1-关键摘要/ 2. L2-结构知识/ 3. L3-核心洞察/。 ## 运行方式: 已经从独立CLI升级为Hermes Agent的Memory Provider插件。 路径在~/.hermes/plugins/。。。/。 Agent通过tiered_memory工具主动操作,脚本后台自动运行衰减、蒸馏、同步。

五大特性:

  1. 1. 自动触发 - 每一级都有明确的升级门槛
  2. 2. 三级缓存 - LRU + Query + Memory
  3. 3. 时间版本 - memory_branches管理历史
  4. 4. 双向同步 - Obsidian人类可读可编辑
  5. 5. 零配置 - 复制文章给Agent,直接开干

写在最后

AI的记忆革命,核心不是"记得更多"。

是"记得更好"。

人脑之所以强大,不是因为记住了所有事情。

恰恰相反,是因为懂得遗忘。

遗忘不是缺陷。遗忘是最高级的记忆管理。

从"记不住"到"懂遗忘",这才是AI记忆系统的未来。


#AI记忆系统 #AI智能体 #人工智能 #知识管理 #大象AI共学

作者:大象-推动 AI 共学,让普通人轻松上手AI

相关链接

  1. Mars Memory Engine(开源参考):https://github.com/FloydTang/mars-memory-engine
  2. 三级记忆系统技术实现:Hermes Agent Memory Provider 插件
  3. 更多AI实战教程:联系作者
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/21 13:05:15

java springboot-vue高校志愿活动管理系统的设计与实现

目录同行可拿货,招校园代理 ,本人源头供货商项目背景技术栈核心功能模块系统亮点适用场景项目技术支持源码获取详细视频演示 :同行可合作点击我获取源码->->进我个人主页-->获取博主联系方式同行可拿货,招校园代理 ,本人源头供货商 项目背景 高校志愿活动…

作者头像 李华
网站建设 2026/5/21 13:04:05

Ryujinx Switch模拟器完整指南:从安装到优化的终极教程

Ryujinx Switch模拟器完整指南:从安装到优化的终极教程 【免费下载链接】Ryujinx 用 C# 编写的实验性 Nintendo Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/ry/Ryujinx Ryujinx是一款功能强大的开源Nintendo Switch模拟器,采用…

作者头像 李华
网站建设 2026/5/21 13:02:43

司美替尼治疗NF1丛状神经纤维瘤效果数据与疗效持续时间说明

司美替尼是中国获批用于 3 岁及以上儿童 1 型神经纤维瘤病(NF1)相关不可切除丛状神经纤维瘤(PN)的靶向药物,其疗效数据均来自全球多中心临床试验,核心数据公开可追溯。SPRINT Ⅱ 期临床试验为该药获批的关键…

作者头像 李华
网站建设 2026/5/21 13:01:07

自创工具!压缩包自定义扩大/缩小文件大小 很牛的一个东西 要么极致压缩要么疯狂扩大

工具:pan.quark.cn/s/d4e63697d02e ZipForge 压缩包体积调节器 - 软件介绍 这是什么软件? ZipForge 是一款实用的压缩包处理工具,专门用来 调节压缩文件的大小 。它有两个核心功能: 扩大压缩包 和 缩小压缩包 。 它能做什么? 扩大压缩包(增大文件体积) 使用场景举例:…

作者头像 李华
网站建设 2026/5/21 12:59:08

缙云定制木门,可以闭眼入

装修那会,为了省钱,我在网上找了个外地木门定制。结果门一装上,空心、隔音差,开关还有嘎吱响,更别说下雨天潮湿,门边居然有点发胀。后来才懂:木门这东西,真不能只看价格,…

作者头像 李华