Agentic AI 时代的记忆系统演进之路

Agent与Memory

当下阶段 AI 应用正在从 Generative AI 向 Agentic AI 阶段迈进，2025 年被视为 Agent 市场元年，Agent 架构相关的技术讨论非常火热，技术演进也非常的快速。

从目前的技术发展趋势看，各类开发框架逐渐从底层专注于与 LLM 的集成演进到上层关注于对 Agent 内部各类组件的抽象和集成，也有了像 MCP 和 A2A 这类定义了 Agent 如何调用工具以及如何与其他 Agent 交互的标准协议的建立，Agent 架构的各个部件逐渐被定义清晰并且形成标准。

上图（来自 The Rise and Potential of Large Language Model Based Agents: A Survey）定义了 Agent 架构，其中包含几个重要部分：

感知能力：让 Agent 能接受多模态的信息输入。
决策能力：让 Agent 能自主决策和规划能力，能够执行更复杂的任务。
记忆能力：让 Agent 具备记忆能力，记忆内部存储Agent的知识和技能。
行动能力：让 Agent 具备与外界交互的能力，通过行动与感知让 Agent能自主完成更多复杂任务。

本文要探讨的便是记忆部分，对Agent至关重要：

让 Agent 具备持续学习能力：Agent 所拥有的知识主要蕴含在 LLM 的参数内，这部分是静态的，记忆让 Agent 具备了知识与经验积累和优化的能力。有研究表明配置了记忆的 Agent 能显著增强性能，Agent 能够从过去经历中总结经验以及从错误中学习，加强任务表现。
让 Agent 能够保持对话的连贯性和行动的一致性：拥有记忆能够让 Agent 具备更远距离的上下文管理能力，在长对话中能够保持一致的上下文从而保持连贯性。也能避免建立与之前相矛盾的事实，保持行动的一致性。
让 Agent 能够提供个性化的服务和用户体验：拥有记忆能够让 Agent 通过历史对话推断用户偏好，构建与用户互动的心理模型，从而提供更符合用户偏好的个性化服务和体验。

如何定义Memory

人脑记忆结构

记忆有不同维度的分类：

1.按存储时间分类：

感知记忆存储人脑从环境捕获的信息(声音、视觉...)
短期记忆存储人脑在思考过程中所需处理的信息，也称工作记忆
长期记忆用于长期保存人类记忆(知识与技能)

感知记忆是人脑的信息输入区，短期记忆（或工作记忆区）是人脑工作时的信息暂存区（或信息加工区），而长期记忆就是人脑的长期信息储存区

2.按内容性质分类：

可声明式记忆，也称显式记忆
不可声明式记忆，也称隐式记忆

这两类的主要区别:

a.是否可以用语言描述：可声明式记忆可以用语言来描述，例如所掌握的某个知识内容。不可声明式记忆不可被语言描述，例如所掌握的某个技能如骑车。

b.是否需要有意识参与：显式记忆需要有意识主动回忆，而隐式记忆无意识参与，所以也被称为肌肉记忆。

3.按存储内容分类：

经历、知识、技能

情境记忆（Episodic Memory）：代表经历，存储了过去发生的事件。
语义记忆（Semantic Memory）：代表知识，存储了所了解的知识。
流程记忆（Procedure Memory）：代表技能，存储了所掌握的技能。

记忆就是人脑对信息进行编码、存储和检索的过程，核心操作：

编码（Encode）：获取和处理信息，将其转化为可以存储的形式。
存储（Storage）：在短期记忆或长期记忆中保留编码信息的过程。
提取（Retrival）：也可称为回忆，即在需要时访问并使存储的信息重新进入意识的过程。

记忆还包含其他的一些操作：

巩固（Consolidation）：通过巩固将短期记忆转变成长期记忆，存储在大脑中，降低被遗忘的可能性。
再巩固（Reconsolidation）：先前存储的记忆被重新激活，进入不稳定状态并需要再巩固以维持其存储的过程。
反思（Reflection）：反思是指主动回顾、评估和检查自己的记忆内容的过程，以增强自我意识，调整学习策略或优化决策的过程。
遗忘（Forgetting）：遗忘是一个自然的过程。

智能体记忆

结合上面概念可以描述为：『存储在哪个记忆区』的『以什么形式存在』的『什么类型的』记忆。

记忆存储的差别：

上下文：智能体的短期/工作记忆区，上下文窗口有限，且过长时容易被遗忘。
LLM：智能体的长期记忆区，蕴含了智能体的大部分知识，包含了不同类型的记忆。
外挂记忆存储：也是属于长期记忆区。

存储形式的差别：

可以简单分为 参数形式 和 非参数形式

KV-Cache(字面上的map的kv对存储的缓存)可以认为是短期记忆区的参数形式记忆，LLM是长期记忆区的参数形式记忆，外挂记忆是长期记忆区非参数形式的记忆。

智能体记忆分类：

这里挑几个熟悉的：

提示词工程（prompt enginerr）属于对短期记忆区的显示记忆优化
知识库（RAG）属于对长期记忆区的显示记忆优化
模型微调（Fine-Tunning）属于对长期记忆区的隐式记忆优化。

智能体记忆操作：

智能体提供的记忆操作与人脑记忆是比较类似的，也包括编码、存储和提取。

记忆编码包含了对记忆的获取和处理，通过对工作记忆区内容的处理发现新的记忆，编码成可存储的结构。

记忆存储为参数或非参数的形式，非参数的形式通常以 Plaintext、Graph 或 Structure-Table 的结构存储。

记忆提取通常通过检索来实现，具体技术实现包括全文检索、向量检索、图检索或者是混合检索，具体检索方式取决于存储的内容和结构。

Agent Memory产品

MemoryBank、LETTA、ZEP、A-MEM、Mem0、MemOS、Mirix

从上述产品的演变趋势来看，Memory正在覆盖越来越多的场景，同时也在覆盖越来越多记忆类型。

早期主要聚焦在对话记忆，现在已经扩展到任务执行、决策支持、个性服务等。

一些被验证的能提升效率的手段：

精细化的记忆管理：记忆在场景、分类和形式上有明确的区分，『分而治之』的思路被证明是有效的优化手段，这个和 Multi-Agent 的优化思路是类似的。
组合多种记忆存储结构：记忆底层存储结构可以大致分为结构化信息（Metadata 或 Tag 等）、纯文本（Text-Chunk、Summary、情境记录等）和知识图谱，会分别构建标签索引、全文索引、向量索引和图索引等提升检索效果。也有基于这些原子索引能力构建场景化的索引，如分层摘要、社区图等。不同的存储结构对应不同的场景，记忆框架由集成单一结构演进到组合多种架构，带来了一定的效果提升。
记忆检索优化：检索方式也在逐步演进，由单一检索演进到混合检索，也有针对 Embedding 和 Reranker 进行调优优化。

Agentic AI 时代的记忆系统演进之路 ​

Agent与Memory ​

如何定义Memory ​

人脑记忆结构 ​