ai for designersMay 9, 202612 min read

设计代理记忆:2026 年设计师手册

智能体记忆是目前无人教授的全新人工智能设计框架。构建用户真正信任的记忆功能,包含 4 种类型、5 项信任原则以及一个研讨会。

By Boone
XLinkedIn
designing agent memory

你的AI产品现在具备记忆功能了。这部分功能并非你设计的,对吧?

大多数团队在2025年和2026年推出记忆功能的方式,和他们在2012年推出通知功能的方式如出一辙:开启记忆功能,看着用户抱怨,然后修补最严重的投诉。这种方法很容易打造出一款容易被遗忘的产品。但对于用户来说,这绝对不是一种值得信任的方式,他们不会把自己的工作、偏好,以及那些让智能体感觉了解他们的小秘密都托付给智能体。

这是智能体记忆功能的设计者手册。读一遍,然后去修复你的产品吧。

智能体记忆的真正含义

智能体记忆是指你的产品在不同会话中记住的用户信息,并利用这些信息来改变其未来的行为。这就是它的完整定义。关键在于“利用这些信息来改变行为”,因为没有行为改变的存储仅仅是一个数据库,而数据库本身并不是一个设计问题。

聊天记录不是记忆。模型在每个提示中默默注入的偏好列表才是记忆。智能体在需要时搜索的过往对话向量存储就是记忆。Claude 中的固定项目上下文或 GPT 中的自定义指令,它们也属于记忆,只是形式和生命周期有所不同。

设计师应该关注任何记忆功能的三个属性:存储什么、何时使用以及谁可以查看和更改。如果你的产品在这三个方面中的任何一个存在模糊不清,你的用户也会感到困惑,而用户对正在使用的产品缺乏信任。

为什么记忆功能在 2025 年和 2026 年成为主流用户体验设计

三个因素汇聚在一起。ChatGPT 在 2025 年初向所有用户推送了记忆功能;Claude 随后不久推出了具有持久上下文的项目;运行长时间上下文窗口的成本最终下降到足以让“记住所有内容”不再是一句玩笑话,而成为一种产品策略。到 2025 年底,记忆功能已成为人工智能产品发布时的标准配置。

用户期望迅速提升。每天使用 Claude、ChatGPT、Cursor 和 Granola 的用户现在期望任何新的 AI 工具都能记住他们。如果 AI 记错了,他们会感到恼火;如果 AI 记住了他们自己都没意识到告诉过它的事情,他们会感到不安。

具备记忆功能的产品数量激增,但拥有良好记忆设计的产品数量仍然接近于零。这其中蕴藏着巨大的机遇。

每位设计师都应该了解的四种记忆类型

大多数团队将记忆视为一个没有区别的容器。这是第一个错误。记忆分为四种不同的类型,每种类型都有不同的存储、呈现和信任要求。

四张标有“偏好设置”、“用户信息”、“进行中”、“行为信号”的体素卡片,采用柔和的粉彩色调,深色工作室背景。
四张标有“偏好设置”、“用户信息”、“进行中”、“行为信号”的体素卡片,采用柔和的粉彩色调,深色工作室背景。

偏好设置是用户对代理行为方式的明确选择,包括语气、格式、长度、语言、跳过哪些内容以及始终包含哪些内容。这些偏好设置是明确的、变化缓慢的,并且需要高度信任。用户希望一次性设置好这些信息,然后就不用管了。

用户信息是指与用户个人相关的信息,例如姓名、职位、公司、参与的项目、使用的工具,以及他们可能提到过的孩子的名字。这些信息积累迅速,而且感觉很私密。用户希望查看、编辑这些信息,并删除那些不相关的条目。

进行中工作上下文是指与特定工作相关的所有内容,例如昨天的品牌简报、用户正在迭代的文档,以及他们上周二粘贴的数据。这些信息在工作期间价值很高,但工作结束后就完全成了噪音。设计的挑战在于如何判断这些信息何时不再有用。

行为信号是代理用来预测用户行为的推断模式。例如,用户总是希望在 TypeScript 中输入代码,用户总是拒绝前三个 logo 设计方案,用户在晚上 9 点比早上 9 点速度更快。这些信息最有用,但也最容易被忽视,而正是这种组合使它们最具风险。

记忆设计的五项信任原则

共有五项原则。忽略其中任何一项,你的记忆功能就会变成一个隐患,随时可能被愤怒的用户截图并发布出去。

可见性。智能体使用的每一项记忆都必须能够一键从对话中找到。不能藏在设置里,不能在帮助文档里,也不能藏在三层菜单里。如果用户不得不问“它怎么知道的”,你就已经输了。

可编辑性。每一条记忆条目都必须可以像文本一样编辑,并且可以一键删除。不要用“我们会用这个来改进我们的模型”这种模棱两可的说法。用户编写了它,用户拥有它,用户可以立即删除它,它就彻底消失了。

作用域性。记忆必须有明确的作用域。可以是每个对话、每个项目、每个账户。你在代码编辑器中偏好的简洁回复不应该影响到你的治疗聊天机器人。作用域是大多数产品都做错的地方,也是最容易破坏信任的环节。

可过期。 内存必须有生命周期,可以由用户声明,也可以由系统推断。正在开发中的上下文应该在工作发布时失效。行为信号应该在行为发生变化时衰减。永久存在的内存会缓慢地泄漏过时数据,污染未来的每一个响应。

可导出。 用户必须能够以可读格式导出内存并将其带到其他地方。JSON、Markdown、纯文本,任选其一。这是其他原则的基石,因为没有什么比让别人阅读你的内存层更能凸显其清晰度了。

ChatGPT 内存和静默更新问题

ChatGPT 内存是世界上使用最广泛的内存功能。它也最清晰地展示了当你遵循了一些原则而忽略了其他原则时会发生什么。

五张分别标有“可见”、“可编辑”、“可限定范围”、“可过期”、“可导出”的体素卡片排列在一块板上,背景为深色摄影棚背景,色调为柔和的粉彩色调。
五张分别标有“可见”、“可编辑”、“可限定范围”、“可过期”、“可导出”的体素卡片排列在一块板上,背景为深色摄影棚背景,色调为柔和的粉彩色调。

可见部分还不错。有一个内存抽屉,你可以打开它,可以看到条目。可编辑部分运行正常,您可以删除条目,删除后条目即消失。目前为止一切顺利。

问题出在静默更新上。ChatGPT 会在正常对话过程中未经询问就写入新的记忆条目,唯一的提示是一个很小的“记忆已更新”提示,两秒钟后便会消失。用户经常会发现几个月来积累的、他们从未明确批准过的信息,包括误读的推断和来自一次性聊天的尴尬琐事。这种默认行为会造成意外,而意外恰恰是信任的反面。

解决方法是在前十次保存记忆时弹出一个简短的权限提示,并每周生成一个摘要,显示自用户上次查看以来新增的内容。但这两个功能都没有实现。这是设计上的选择,而非技术上的限制。

Claude 项目记忆及其优点

Claude 的方法与 ChatGPT 的方法截然相反。 Claude 中的内存主要存在于项目内部,项目是用户创建的容器,包含明确的指令和上传的文件。用户创建项目、命名项目并填充上下文。内存的使用是默认启用的。

这完美地解决了范围问题。你的“营销策略”项目不会污染你的“治疗日志”项目,因为它们是具有独立上下文的容器。用户理解边界,因为它是由用户自己设定的。

但缺点是 Claude 的功能较少。它不会自动记住你在不同项目中的偏好,因此你最终会重复自己。较新的 Claude 内存功能正在逐步弥补这一不足,但设计理念已经很明确:用户设定的范围比系统推断的范围更值得信赖,即使这会牺牲一些便利性。

Cursor 规则、.cursorrules 模式和内存即代码

Cursor 使用了完全不同的模型。项目规则存储在仓库中名为 .cursorrules.cursor/rules/ 的文件中。开发者以纯文本形式编写规则,提交到 Git,代理会在每次交互时读取这些规则。

这就是内存即代码。它免费具备信任原则的所有属性,因为仓库中的文本文件本身就是可见、可编辑、可作用域和可导出的。唯一的弱点是过期,开发者必须通过编辑文件来处理过期问题。

对于非开发者产品而言,教训并非“发布一个配置文件”。教训在于,可以作为单个文档读取的内存比必须通过用户界面查询的内存更安全。设计内存抽屉时,应先设计文档视图,然后再在其上设计编辑器。

Granola、自定义 GPT 指令和内存形状的长尾

会议记录工具 Granola 将每个笔记本视为独立的上下文。代理读取笔记本中的内容来编写新的笔记。系统不会全局记忆你的信息。记忆的形式是“房间里有什么就有什么”,这种方式之所以有效,是因为会议本身就具有一定的局限性。

自定义 GPT 指令是现代人工智能时代最古老的记忆形式。创建者编写系统提示,用户选择 GPT,提示决定了用户的每一个回复。这种方式很脆弱,缺乏适应性,但由于其极其简单易懂,仍然是使用最广泛的记忆机制。

所有这些记忆设计的共同点在于:最佳的记忆设计让用户成为记忆的创造者,而最糟糕的设计则让系统成为创造者,用户成为受众。

四张体素卡片分别标有“怪胎”、“惊喜”、“封锁”和“记忆洞”,背景为深色摄影棚,色调为柔和的粉彩色。
四张体素卡片分别标有“怪胎”、“惊喜”、“封锁”和“记忆洞”,背景为深色摄影棚,色调为柔和的粉彩色。

你必须避免的四种失效模式

每一种记忆功能都可能以四种方式失效。请列出这些失效模式,密切关注它们,并在设计评审中将其剔除。

记忆蔓延。 记忆的积累速度超过了用户整理记忆的速度。三个月后,用户积累了 400 条记录,其中一半是错误的或过时的,而且没有有效的清理方法。可以通过设置记录大小上限、设置过期时间以及使用批量删除工具来解决这个问题。

意外情况:代理使用了用户不知道的记忆,用户感觉被监视。可以通过主动披露、在每次回复中提供“你为什么这么说”的提示以及在首次使用记忆时进行明确确认来解决这个问题。

用户锁定:用户无法离开,因为他们的记忆被困在你的产品中。可以通过一键导出为便携格式、无需营销邮件限制以及无需提交支持工单来解决这个问题。

记忆漏洞:代理忘记了用户最需要记住的内容。用户重复输入相同的内容五次后,转而使用其他产品。可以通过明确设置记录位置、提供一个功能齐全的“记住这个”按钮以及一个可以验证记录是否存在的记忆检查器来解决这个问题。

请选择你的产品目前最接近上述哪种情况。这就是您下一季度的路线图。

记忆功能的设计词汇

您无法设计您无法命名的东西。以下是优秀团队正在共同采用的工作词汇,您可以直接借鉴其中的定义。

记忆卡是存储记忆的基本单元。一张卡片,一个事实或偏好,一个时间戳,一个范围,一个来源。像展示消息一样展示卡片,确保每张卡片都具有一致的交互体验。

*​​范围标签**是一个小小的标签,用于声明记忆或会话的范围。例如:“本次对话”、“本项目”、“您的所有工作”、“所有内容”。范围标签可以添加到记忆卡、对话以及代理引用记忆时的回复中。

衰减计时器是记忆条目上可见的倒计时或过期标签。例如:“14 天后过期”、“保留至项目结束”、“永久保存”。衰减计时器将过期的抽象概念转化为用户可以查看和更改的内容。

审计跟踪记录了代理执行的操作及其原因,包括每次回复中使用的内存。确保每条消息都提供一键访问审计跟踪的功能。第一个能够完美实现 AI 回复审计跟踪的产品将在未来十年内主导信任市场。

内存检查器是所有已存储内存的全屏视图,按范围组织,可按来源筛选,并可按最近使用时间排序。这是 AI 产品中最重要的界面,但大多数产品都没有配备。

内存功能设计工作坊

以下是一个六步工作坊,您可以在一个下午的时间里完成,从零开始设计一个内存功能。请携带一名设计师、一名产品经理和一名了解模型层的工程师。

体素设计师工作区,存储卡整齐排列,审计跟踪清晰可见,示波器芯片摆放在板上,柔和的粉彩色调,深色工作室背景。
体素设计师工作区,存储卡整齐排列,审计跟踪清晰可见,示波器芯片摆放在板上,柔和的粉彩色调,深色工作室背景。
  1. 列出您产品的四种内存类型。针对每种类型,用一句话描述您的代理应该记住的内容。如果某种类型不适用,请明确地将其删除。 2. 绘制内存检查器。只需检查器,无需其他界面。单个内存卡的显示界面是什么样的?有哪些筛选器?用户可以删除、编辑、固定或导出哪些内容?

  2. 确定每种类型的默认范围。例如,按对话、按项目或全局。用一句话解释每种选择的理由。如果无法解释,则默认设置不合理。

  3. 设置每种类型的过期策略。可以是固定期限、与“项目关闭”等事件绑定,或“永久有效,直到用户删除”。任何类型都不能含糊不清。

  4. 设计信息披露方式。用户如何知道内存何时被保存、何时被使用以及何时被更新?具体说明如何使用提示信息、徽章、内联引用和每周摘要。

  5. 编写导出格式。打开文本编辑器,编写导出按钮将为拥有 200 条内存条目的重度用户生成的 JSON 或 Markdown 格式。如果代码读起来像数据库转储,那就重新设计,直到它读起来像笔记。

这就是工作坊。在编写第一行内存代码之前运行它,并在发布后再次运行,以便了解用户实际使用的内容。

主要产品现状快速对比

以下是大多数团队目前参考的产品的评分卡。随着产品更新,实际情况可能会有所不同,但优缺点模式基本稳定。

| 产品 | 可见 | 可编辑 | 范围明确 | 可过期 | 可导出 |

|---|---|---|---|---|---|

| ChatGPT 内存 | 部分 | 是 | 弱 | 否 | 否 |

| Claude 项目 | 是 | 是 | 强 | 手动 | 部分 |

| 光标规则 | 是 | 是 | 强 | 手动 | 是 |

| Granola 笔记本 | 是 | 是 | 强 | 不适用 |部分 |

| 自定义 GPT 指令 | 是 | 是 | 强 | 手动 | 是 |

模式很清晰。允许用户创建容器的产品在范围和可导出性方面得分最高,但代价是便利性。自动管理内存的产品在便利性方面得分最高,但代价是信任。目前还没有产品能够真正解决这两个问题,因此这仍然是一个广阔的设计空间。

这对未来两到三年意味着什么

以下三点预测,我们都非常有信心。

内存检查器将成为标准产品界面。在 18 个月内,所有严肃的 AI 产品都将配备专门的内存屏幕,而该屏幕的质量将成为用户选择产品的三大主要原因之一。现在就开始设计你的产品吧。

信任原则将得到规范。人工智能记忆的可见性、可编辑性和可导出性将出现在隐私法中,可能首先在欧盟实施,并可能在2028年之前广泛普及。那些将这些功能视为特性而非合规工作的产品将赢得高信任度市场。

记忆将成为品牌。人们选择使用某个人工智能产品而非其他产品的原因将不再是模型质量,而是产品记住用户信息的能力。模型是商品,记忆才是护城河。能够为产品赢得护城河的设计师将成为本轮人工智能团队中最有价值的人才。

现在你已经掌握了框架。打开你的产品,找到一个违反五项原则之一的记忆功能,并在本周内修复它。

记忆并非设置问题,而是以存储形式呈现的关系问题。每个记忆条目都代表着你的产品对用户身份的一种解读,而这种解读要么符合用户的自我认知,要么与之相悖。

本轮制胜的团队将像管理搜索或用户引导流程一样管理记忆功能。一位专职负责人,每周审查存储内容及其原因,并制定内存准确性和用户信任度的真实指标。这并非后端工程师的副业。

如果你的路线图下一季度没有内存相关的工作,那么这个路线图就是错误的。打开文档,添加工作,并指定负责人。先到先得的窗口期正在迅速关闭。

Need a designer who actually understands AI products? Hire Brainy to design your memory layer.

Get Started

More from Brainy Papers

Keep reading