本报讯你家的智能助手是不是有个怪毛病——用得越多,表现得越笨?这个困扰开发者和用户已久的现象,近日被香港中文大学和浙江大学的研究团队找到了答案。
记忆是个伪命题?
这项于2026年4月30日发布在arXiv平台的研究论文,直指当前AI Agent记忆方案的核心问题。研究团队指出,市面上流行的向量数据库、RAG检索增强技术、长上下文窗口等所谓"记忆系统",本质上只是"备忘录",而非真正的记忆。
"这些系统做的是'查找'而不是'记忆'",研究团队在论文中写道。简单来说,就像我们查字典和记住一个知识点是两个概念。
三大硬伤
研究团队通过理论证明和实证分析,揭示了现有记忆系统的三大结构性缺陷。
首先是信息量不等于能力提升。AI Agent的会话结束后,模型权重保持不变,无法像人类专家那样通过经验重组知识。这意味着,用再多数据"喂"AI,它也无法真正"学会"。
其次是泛化能力存在天花板。检索式记忆处理复杂任务时,需要的案例数量呈平方级增长,而人类式的参数化记忆则线性增长。扩大上下文窗口也突破不了这个限制。
第三是安全漏洞。研究引用MINJA攻击测试数据显示,AI记忆系统遭受投毒攻击的成功率高达98.2%,仅5条恶意文本就能实现90%的攻击成功率。
神经科学给出的答案
研究人员参照神经科学的互补学习系统(CLS)理论解释了这一现象。当前AI Agent只有"海马体"——能快速记住具体情景,但缺乏"新皮层"——无法将经验抽象为通用规则。
破局之道:双系统架构
针对这些问题,研究团队提出"双系统并存"架构方案。保留现有的检索式情景记忆,同时增加一条异步通道,将情景记忆逐步整合进模型权重。
具体技术手段包括LoRA、MEMIT、TTT层、自我蒸馏(SSR)等。研究团队呼吁开发者、基准设计者和研究社区共同关注这一方向。
该论文在X(Twitter)平台被@dair_ai 转发后获得超过2.6万次浏览,引发行业热议。