news 2026/6/12 15:04:12

探索未来智能记忆系统 - MemU

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
探索未来智能记忆系统 - MemU

MemU: 前沿智能记忆系统

在当今人工智能和大语言模型(LLMs)快速发展的背景下,MemU应运而生。它是一个功能强大的智能记忆框架,旨在为LLM和AI智能体提供后端支持,能够处理多模态输入(包括对话、文档、图像等),并将这些数据提取到结构化的记忆中,从而构建一个支持嵌入基础(RAG)和非嵌入(LLM)检索的层次化文件系统。

核心功能

MemU具有以下四大核心功能:

功能描述
🗂️层次化文件系统三层架构:资源 → 项目 → 类别,支持全生命周期追溯
🔍双重检索方法RAG(基于嵌入)提供速度,LLM(非嵌入)深入语义理解
🎨多模态支持处理对话、文档、图像、音频和视频
🔄自我演化记忆根据使用模式逐步优化和改进记忆结构

层次化文件系统

MemU采用三层架构对记忆进行组织,受到层次存储系统的启发。具体结构如下:

层级描述示例
资源原始多模态数据仓库JSON对话、文本文档、图像、视频
项目提取的离散记忆单元个人偏好、技能、观点、习惯
类别聚合的文本记忆及摘要preferences.mdwork_life.mdrelationships.md

主要好处:

  • 全生命周期追溯:可以从原始数据追踪到项目和类别,并反向查找
  • 渐进总结:每一层都提供更抽象的视图
  • 灵活组织:根据内容模式逐步演化的类别

多模态支持

MemU能够处理各种内容类型并将其整合为统一的记忆结构:

模态输入处理
对话JSON聊天记录提取偏好、观点、习惯、关系
文档文本文件(.txt,.md)提取知识、技能、事实
图像PNG、JPG等视觉模型提取视觉概念和描述
视频视频文件帧提取 + 视觉分析
音频音频文件转录 + 文本处理

所有模态都统一到同一三层体系结构中,从而支持跨模态检索。

快速开始

选项 1:云版本

无需任何设置,即可立即尝试MemU:

👉memu.so- 完整API访问的托管云服务

企业部署和定制解决方案,请联系info@nevamind.ai

云API (v3)
基础URLhttps://api.memu.so
认证Authorization: Bearer YOUR_API_KEY
方法接口描述
POST/api/v3/memory/memorize注册记忆任务
GET/api/v3/memory/memorize/status/{task_id}获取任务状态
POST/api/v3/memory/categories列出记忆类别
POST/api/v3/memory/retrieve检索记忆(语义搜索)

📚完整API文档

选项 2:自行托管

安装
pipinstall-e.
基本示例

需求:Python 3.13+ 和 OpenAI API 密钥

测试内存存储(无需数据库):

exportOPENAI_API_KEY=your_api_keycdtests python test_inmemory.py

测试PostgreSQL存储(需要pgvector):

# 启动使用pgvector的PostgreSQLdockerrun -d\--name memu-postgres\-ePOSTGRES_USER=postgres\-ePOSTGRES_PASSWORD=postgres\-ePOSTGRES_DB=memu\-p5432:5432\pgvector/pgvector:pg16# 运行测试exportOPENAI_API_KEY=your_api_keycdtests python test_postgres.py

这两个示例演示了完整的工作流程:

  1. 记忆:处理对话文件并提取结构化记忆
  2. 检索(RAG):快速的基于嵌入的搜索
  3. 检索(LLM):深层语义理解的搜索

核心API

memorize()- 提取并存储记忆

处理输入资源并提取结构化记忆:

result=awaitservice.memorize(resource_url="path/to/file.json",# 文件路径或URLmodality="conversation",# conversation | document | image | video | audiouser={"user_id":"123"}# 可选:限制特定用户)

retrieve()- 查询记忆

根据查询检索相关记忆。MemU支持两种检索策略

基于RAG的检索(method="rag"

快速的嵌入向量搜索,使用余弦相似度:

  • 快速:纯向量计算
  • 可扩展:适用于大型记忆存储
  • 返回分数:每个结果包含相似度分数
基于LLM的检索(method="llm"

通过直接LLM推理进行深层语义理解

  • 深入理解:LLM理解上下文和细微差别
  • 查询重写:自动在每个层级重新构建查询
  • 适应性强:在找到足够信息时提前停止
对比
方面RAGLLM
速度⚡ 快速🐢 较慢
成本💰 低💰💰 较高
语义深度中等深入
第二层范围所有项目仅相关类别中的项目
输出含相似度分数根据LLM推理排名

使用案例

示例 1:对话记忆

从多轮对话中提取和组织记忆:

exportOPENAI_API_KEY=your_api_key python examples/example_1_conversation_memory.py

效果:

  • 处理多个对话JSON文件
  • 提取记忆项目(偏好、习惯、观点、关系)
  • 生成类别markdown文件(preferences.mdwork_life.md等)

适用场景:个人AI助手、客户支持机器人、社交聊天机器人

示例 2:从日志中提取技能

从代理执行日志中提取技能和经验教训:

exportOPENAI_API_KEY=your_api_key python examples/example_2_skill_extraction.py

效果:

  • 顺序处理代理日志
  • 提取行动、结果和经验教训
  • 演示增量学习- 记忆随每个文件演化
  • 生成演变的技能指导(log_1.mdlog_2.mdskill.md

适用场景:DevOps团队、代理自我提升、知识管理

示例 3:多模态记忆

处理多种内容类型并统一记忆:

exportOPENAI_API_KEY=your_api_key python examples/example_3_multimodal_memory.py

效果:

  • 同时处理文档和图像
  • 从不同内容类型中提取记忆
  • 统一为跨模态类别(technical_documentationvisual_diagrams等)

适用场景:文档系统、学习平台、研究工具

绩效

MemU在Locomo基准测试中实现了92.09%的平均准确率,覆盖各种推理任务。

生态系统

存储库描述用例
memU核心算法引擎将AI记忆嵌入到产品中
memU-server提供CRUD、用户系统、RBAC的后端服务自托管的记忆后端
memU-ui视觉仪表板即用的记忆控制台

类似项目

在MemU的背后,有许多其他竞争力强的开源项目也在解决记忆和信息检索的问题。例如:

  • Milvus:一个开源的向量数据库,可实现高效的相似性搜索和检索服务,适用于各种AI应用。
  • Chroma:提供文档和数据检索的解决方案,支持多种数据类型和高效索引。
  • Haystack:一个用于构建与搜索相关的应用的框架,可以帮助开发人员轻松集成LLM和信息检索。

使用这些项目可以进行定制化的解决方案,以满足特定场景下的信息检索需求,然而,MemU凭借其多模态输入和自我演化记忆的能力,展现出了独特的优势。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/5 3:15:46

[特殊字符] 提升你编码效率的超级助手:Awesome GitHub Copilot

🤖 让你的GitHub Copilot焕然一新 — Awesome GitHub Copilot Customizations 在开发过程中,GitHub Copilot凭借其出色的辅助编码功能,已经成为了许多开发者的得力助手。今天,我们将介绍一个为GitHub Copilot提供强大定制功能的项…

作者头像 李华
网站建设 2026/6/5 20:39:26

day169—递归—打家劫舍Ⅲ(LeetCode-337)

题目描述 小偷又发现了一个新的可行窃的地区。这个地区只有一个入口,我们称之为 root 。 除了 root 之外,每栋房子有且只有一个“父“房子与之相连。一番侦察之后,聪明的小偷意识到“这个地方的所有房屋的排列类似于一棵二叉树”。 如果 两…

作者头像 李华
网站建设 2026/6/10 5:25:24

学习笔记——I2C(Inter-Intergrated Circuit)总线详解

I2C(Inter-Intergrated Circuit)总线详解 一、I2C总线基本概念 1.1 I2C简介 I2C(Inter-Integrated Circuit)是由Philips公司开发的一种串行、同步、半双工的通信总线。主要特点: 两根线:SDA(…

作者头像 李华
网站建设 2026/6/9 22:20:52

大数据领域Spark在餐饮行业的数据分析应用

大数据领域Spark在餐饮行业的数据分析应用 关键词:大数据、Spark、餐饮行业、数据分析、应用 摘要:本文聚焦于大数据领域中Spark在餐饮行业数据分析的应用。首先介绍了研究的背景、目的、预期读者等内容,接着阐述了Spark和餐饮行业数据分析的核心概念及联系,详细讲解了相关…

作者头像 李华
网站建设 2026/6/9 17:19:37

炸裂开局!AI应用架构师引领AI驱动流程自动化新方向

炸裂开局!AI应用架构师引领AI驱动流程自动化新方向:用大语言模型重构业务流程 告别僵化规则,拥抱认知智能:构建能理解、会决策、可进化的下一代自动化流程。 第一部分:引言与基础 标题: 超越RPA&#xff1a…

作者头像 李华