Diseñando la memoria del agente: El manual del diseñador de 2026
La memoria del agente es la nueva superficie de diseño de IA que nadie enseña. Crea funciones de memoria en las que los usuarios realmente confíen con 4 tipos, 5 principios de confianza, además de un taller.

Tu producto de IA ahora recuerda cosas. No diseñaste esa parte, ¿verdad?
La mayoría de los equipos implementaron la memoria en 2025 y 2026 de la misma manera que implementaron las notificaciones en 2012: activándola, observando la ira de los usuarios y solucionando las peores quejas. Esa es una buena manera de crear un producto olvidable. Es una pésima manera de lograr que los usuarios confíen en él para su trabajo, sus preferencias y esos pequeños detalles embarazosos que hacen que un agente sienta que los conoce.
Este es el manual del diseñador para la memoria de agentes. Léelo una vez y luego corrige tu producto.
Qué es realmente la memoria de agentes
La memoria de agentes es todo aquello que tu producto recuerda sobre un usuario a lo largo de las sesiones y que utiliza para modificar su comportamiento futuro. Esa es la definición completa. La palabra clave es "utiliza para modificar", porque el almacenamiento sin modificación del comportamiento es solo una base de datos, y una base de datos no es un problema de diseño.
Un registro del historial de chat no es memoria. Una lista de preferencias que el modelo inyecta silenciosamente en cada mensaje sí es memoria. Un almacén vectorial de conversaciones pasadas que el agente consulta cuando es relevante constituye la memoria. El contexto del proyecto fijado en Claude o las instrucciones personalizadas en una GPT también son memoria, solo que con estructuras y duraciones diferentes.
Los diseñadores deben prestar atención a tres propiedades de cualquier función de memoria: qué se almacena, cuándo se utiliza y quién puede verlo y modificarlo. Si su producto no es claro en alguno de estos tres aspectos, sus usuarios tampoco lo serán, y los usuarios con información poco clara no confían en lo que utilizan.
Por qué la memoria se popularizó en la UX en 2025 y 2026
Tres factores convergieron. ChatGPT implementó la memoria para todos a principios de 2025, Claude lanzó proyectos con contexto persistente poco después, y el coste de mantener ventanas de contexto largas finalmente disminuyó lo suficiente como para que la idea de "recordarlo todo" dejara de ser una broma y se convirtiera en una estrategia de producto. A finales de 2025, la memoria era una característica estándar en los lanzamientos de productos de IA.
Las expectativas de los usuarios no tardaron en crecer. Quienes usan Claude, ChatGPT, Cursor y Granola a diario esperan que cualquier nueva herramienta de IA los recuerde. Se molestan cuando la recuerda incorrectamente y se asustan cuando recuerda información que no se habían dado cuenta de haberle proporcionado.
La oferta de productos con funciones de memoria se ha disparado. Sin embargo, la oferta de productos con un buen diseño de memoria sigue siendo prácticamente nula. Esa brecha representa una gran oportunidad.
Los cuatro tipos de memoria que todo diseñador debería conocer
La mayoría de los equipos tratan la memoria como un concepto único e indiferenciado. Ese es el primer error. Existen cuatro tipos distintos, y cada uno tiene diferentes requisitos de almacenamiento, visualización y confianza.

Las Preferencias son las elecciones que el usuario especifica sobre cómo debe comportarse el agente. Tono, formato, longitud, idioma, qué omitir, qué incluir siempre. Estas preferencias son explícitas, cambian lentamente y requieren mucha confianza. Los usuarios desean configurarlas una sola vez y olvidarse de ellas.
Los datos del usuario son información sobre el usuario como persona. Nombre, puesto, empresa, proyectos en los que trabaja, herramientas que utiliza, nombres de sus hijos si los menciona. Esta información se acumula rápidamente y genera una sensación de cercanía. Los usuarios desean verla, editarla y eliminar la información extraña.
El contexto del trabajo en curso abarca todo lo relacionado con un trabajo específico. El brief de marca de ayer, el documento en el que el usuario está trabajando, los datos que pegó el martes pasado. Esta información es muy valiosa durante el trabajo y pura información irrelevante después. El reto del diseño reside en saber cuándo deja de ser útil.
Las señales de comportamiento son patrones inferidos que el agente utiliza para predecir qué hacer. El usuario siempre quiere código en TypeScript, siempre rechaza los tres primeros conceptos de logotipo, es más rápido a las 9 p. m. que a las 9 a. m. Estas señales son las más útiles y las más invisibles, y esa combinación las convierte en las más peligrosas.
Los cinco principios de confianza para el diseño de la memoria
Hay cinco principios. Si omites cualquiera de estos pasos, tu función de memoria se convierte en un riesgo que un usuario enfadado podría capturar y publicar.
Visible. Cada fragmento de memoria que utilice el agente debe ser accesible con un solo clic desde la conversación. No en la configuración, ni en la documentación de ayuda, ni oculto en tres menús. Si el usuario tiene que preguntar "¿cómo lo sabe?", ya has perdido.
Editable. Cada entrada de memoria debe ser editable como texto y eliminable con un solo clic. Nada de ambigüedades como "lo usaremos para mejorar nuestro modelo". El usuario lo escribió, el usuario es el propietario, el usuario puede eliminarlo ahora y desaparecerá.
Ámbito definido. La memoria debe tener un ámbito definido. Por conversación, por proyecto, por cuenta. La preferencia por respuestas breves en el editor de código no debe afectar a tu chatbot de terapia. El ámbito es el aspecto en el que la mayoría de los productos fallan, y es el fallo que destruye la confianza más rápidamente.
Caducable. La memoria debe tener una vida útil, ya sea declarada por el usuario o inferida por el sistema. El contexto del trabajo en curso debe desaparecer cuando se publique el trabajo. Las señales de comportamiento deben desaparecer si el comportamiento cambia. La memoria que permanece indefinidamente se convierte en una fuga lenta de datos obsoletos que contaminan cada respuesta futura.
Exportable. Los usuarios deben poder exportar su memoria en un formato legible y llevarla a otro lugar. JSON, Markdown, texto plano, cualquiera. Este es el principio que demuestra los demás, porque nada impone tanta claridad como tener que escribir la memoria paso a paso para que otra persona la lea.
ChatGPT Memoria y el problema de las actualizaciones silenciosas
ChatGPT La memoria es la función de memoria más utilizada en el mundo. También es la que demuestra con mayor claridad lo que sucede cuando se aplican algunos principios pero se ignoran otros.

La parte visible es aceptable. Hay un cajón de memoria, se puede abrir y se pueden ver las entradas. La parte editable funciona: puedes borrar una entrada y desaparece. Hasta aquí todo bien.
El problema radica en las actualizaciones silenciosas. ChatGPT escribe nuevas entradas de memoria durante una conversación normal sin preguntar, y la única señal es una pequeña notificación emergente de "Memoria actualizada" que desaparece en dos segundos. Los usuarios descubren con frecuencia meses de información acumulada que nunca aprobaron explícitamente, incluyendo inferencias malinterpretadas y detalles embarazosos de una conversación puntual. El comportamiento predeterminado genera sorpresa, y la sorpresa es lo opuesto a la confianza.
La solución sería una pequeña solicitud de permiso las primeras diez veces que se guarda una memoria, además de un resumen semanal que muestre lo que se agregó desde la última vez que el usuario revisó. Ninguna de las dos opciones existe. Se trata de una decisión de diseño, no de una limitación técnica.
Memoria de Claude en proyectos y sus aciertos
El enfoque de Claude es opuesto al de ChatGPT. En Claude, la memoria reside principalmente dentro de proyectos, que son contenedores creados por el usuario con instrucciones explícitas y archivos subidos. El usuario crea el proyecto, le da un nombre y lo completa con contexto. La memoria es opcional por diseño.
Esto resuelve el problema del alcance de forma clara. Tu proyecto de "Estrategia de Marketing" no contamina tu proyecto de "Diario de Terapia", ya que son contenedores separados con contextos separados. El usuario comprende los límites porque él mismo los definió.
La desventaja es que Claude ofrece menos funciones. No hay memoria automática de tus preferencias entre proyectos, por lo que terminas repitiendo código. Las nuevas funciones de memoria de Claude están empezando a solucionar este problema, pero la lección de diseño ya es evidente. Los alcances definidos por el usuario generan más confianza que los alcances inferidos por el sistema, incluso si implican una pequeña pérdida de comodidad.
Reglas del cursor, el patrón .cursorrules y la memoria como código
Cursor utiliza un modelo completamente diferente. Las reglas del proyecto se encuentran en un archivo del repositorio llamado .cursorrules o en .cursor/rules/. Los desarrolladores escriben las reglas en texto plano, las suben a Git y el agente las lee en cada interacción.
Esto es memoria como código. Posee todas las propiedades de los principios de confianza de forma gratuita, ya que los archivos de texto en un repositorio son visibles, editables, con ámbito definido y exportables por definición. El único punto débil es la caducidad, que el desarrollador debe gestionar editando el archivo.
La lección para los productos que no son para desarrolladores no es "distribuir un archivo de configuración". La lección es que la memoria que se puede leer como un solo documento se siente más segura que la memoria que hay que consultar a través de una interfaz de usuario. Al diseñar un cajón de memoria, diseñe primero la vista del documento y luego el editor que se superpone a ella.
Granola, instrucciones GPT personalizadas y la larga cola de formas de memoria
Granola, la herramienta de notas de reuniones, trata cada cuaderno como un contexto propio. El agente lee el contenido del cuaderno para escribir nuevas notas. No existe una memoria global del usuario. La estructura es "la memoria es lo que está presente en la sala", lo cual funciona porque las reuniones tienen límites naturales.
Las instrucciones GPT personalizadas son la estructura de memoria más antigua en la era de la IA moderna. El creador escribe una solicitud del sistema, el usuario elige la GPT y la solicitud da forma a cada respuesta. Es frágil, no se adapta y, aun así, sigue siendo el mecanismo de memoria más utilizado en términos absolutos porque es extremadamente simple y totalmente legible.
El patrón común a todos estos sistemas es que los mejores diseños de memoria convierten al usuario en el autor de la memoria. Los peores convierten al sistema en el autor y al usuario en la audiencia.

Los cuatro modos de fallo que debe evitar al diseñar
Cada función de memoria falla de una de cuatro maneras. Identifíquelas, búsquelas y elimínelas durante la revisión del diseño.
El problema de la acumulación de información. La memoria se acumula más rápido de lo que el usuario puede gestionarla. Después de tres meses, el usuario tiene 400 entradas, la mitad de ellas incorrectas o desactualizadas, y no hay una forma realista de limpiarlas. Solucione esto con límites de memoria, temporizadores de caducidad y herramientas de eliminación masiva.
La sorpresa. El agente utiliza información de memoria que el usuario desconocía, y este se siente vigilado. Solucione esto con información proactiva, una opción para preguntar "¿Por qué dijiste eso?" en cada respuesta y una confirmación explícita la primera vez que se utilice la información de memoria.
El bloqueo. El usuario no puede irse porque su información de memoria está atrapada en su producto. Solucione esto con una exportación con un solo clic a un formato portátil, sin restricciones de correo electrónico de marketing y sin necesidad de un ticket de soporte.
El olvido. El agente olvida lo que el usuario más necesita recordar. El usuario repite el mismo contexto cinco veces y cambia de producto. Solucione esto con fijación explícita, un botón de "recordar esto" que funcione correctamente y un inspector de memoria que demuestre que la entrada existe.
Elija a cuál de estas soluciones se parece más su producto actualmente. Esa será su hoja de ruta para el próximo trimestre.
El vocabulario de diseño para las funciones de memoria
No se puede diseñar lo que no se puede nombrar. Aquí tienes el vocabulario de trabajo que están adoptando los mejores equipos, con definiciones que puedes adaptar.
Una tarjeta de memoria es la unidad básica de memoria almacenada. Una tarjeta, un dato o preferencia, una marca de tiempo, un alcance, una fuente. Muestra las tarjetas como si fueran mensajes, con funcionalidades consistentes en cada una.
Un chip de alcance es una pequeña etiqueta que indica el alcance de una memoria o una sesión. Por ejemplo: «Esta conversación», «este proyecto», «todo tu trabajo», «todo». Los chips de alcance se colocan en las tarjetas de memoria, en las conversaciones y en las respuestas del agente cuando este hace referencia a la memoria.
Un temporizador de caducidad es una cuenta atrás o etiqueta de vencimiento visible en una entrada de memoria. Por ejemplo: «Caduca en 14 días», «se conserva hasta que finalice el proyecto», «permanente». Los temporizadores de caducidad convierten la idea abstracta de caducidad en algo que el usuario puede ver y modificar.
Un registro de auditoría es un registro de las acciones del agente y sus motivos, incluyendo qué memorias utilizó en cada respuesta. Conviértalo en una función de un solo clic en cada mensaje. El primer producto que logre implementar correctamente las pistas de auditoría para las respuestas de la IA dominará el mercado de la confianza durante la próxima década.
Un inspector de memoria es una vista a pantalla completa de toda la memoria almacenada, organizada por alcance, filtrable por origen y ordenable por fecha de uso. Esta es la pantalla más importante de su producto de IA, y la mayoría de los productos no la tienen.
Taller de diseño de funciones de memoria
Aquí tiene un taller de seis pasos que puede realizar en una tarde para diseñar una función de memoria desde cero. Reúna a un diseñador, un gerente de producto y un ingeniero con experiencia en la capa de modelado.

-
Enumere los cuatro tipos de memoria para su producto. Escriba una frase por tipo describiendo lo que su agente debe recordar en ese tipo. Si un tipo no aplica, elimínelo explícitamente.
-
Dibuje el inspector de memoria. Solo el inspector, sin otras pantallas. ¿Cómo se ve una tarjeta de memoria individual? ¿Qué filtros existen? ¿Qué puede eliminar, editar, fijar o exportar el usuario?
-
Decide el alcance predeterminado para cada tipo: por conversación, por proyecto o global. Justifica cada elección en una sola frase. Si no puedes justificarla, el alcance predeterminado es incorrecto.
-
Establece la política de caducidad para cada tipo: una duración fija, un evento vinculado como "el proyecto se cierra" o "permanente hasta que el usuario lo elimine". Ningún tipo debe ser ambiguo.
-
Diseña la información. ¿Cómo sabrá el usuario cuándo se guarda, se usa y se actualiza la memoria? Sé específico con respecto a las notificaciones, insignias, citas en línea y resúmenes semanales.
-
Escribe el formato de exportación. Abre un editor de texto y escribe el JSON o Markdown que generará tu botón de exportación para un usuario intensivo con 200 entradas de memoria. Si parece un volcado de base de datos, rediséñalo hasta que parezca un conjunto de notas.
Este es el taller. Ejecútalo antes de escribir tu primera línea de código para la memoria y vuelve a ejecutarlo después del lanzamiento cuando descubras qué utilizan realmente los usuarios.
Comparación rápida de los principales productos
Aquí tienes la tabla comparativa de los productos que la mayoría de los equipos utilizan actualmente. Los resultados pueden variar con las actualizaciones, pero el patrón de fortalezas y debilidades se mantiene estable.
| Producto | Visible | Editable | Alcance | Caducable | Exportable |
|---|---|---|---|---|---|
| Memoria ChatGPT | Parcial | Sí | Débil | No | No |
| Proyectos Claude | Sí | Sí | Fuerte | Manual | Parcial |
| Reglas de cursor | Sí | Sí | Fuerte | Manual | Sí |
| Cuadernos Granola | Sí | Sí | Fuerte | N/A | Parcial |
| Instrucciones GPT personalizadas | Sí | Sí | Fuerte | Manual | Sí |
El patrón es claro. Los productos que permiten al usuario crear el contenedor obtienen las mejores puntuaciones en alcance y exportabilidad, y su precio es la comodidad. Los productos que automatizan la memoria obtienen la máxima puntuación en comodidad, y su precio es la confianza. Todavía no existe ningún producto que haya resuelto ambos problemas por completo, por lo que este sigue siendo un campo de diseño con un amplio margen de mejora.
¿Qué significa esto para los próximos dos o tres años?
Tres predicciones, todas con la suficiente confianza como para apostar por ellas.
Los inspectores de memoria se convertirán en una interfaz de producto estándar. En 18 meses, todos los productos de IA serios contarán con una pantalla de memoria dedicada, y la calidad de dicha pantalla será uno de los tres principales motivos por los que los usuarios elegirán un producto u otro. Empiece a diseñar la suya ahora.
Los principios de confianza se regularán. La visibilidad, la posibilidad de edición y la exportabilidad de la memoria de IA aparecerán en la legislación sobre privacidad, probablemente primero en la UE, y probablemente de forma generalizada para 2028. Los productos que las consideren características en lugar de requisitos de cumplimiento dominarán el segmento de alta confianza.
La memoria se convertirá en la marca. El motivo por el que los usuarios se decantarán por un producto de IA en lugar de otro dejará de ser la calidad del modelo y pasará a ser la capacidad del producto para recordarlos. El modelo es un producto básico, la memoria es la ventaja competitiva. Los diseñadores que logren esa ventaja competitiva para sus productos serán los profesionales más valiosos en los equipos de IA durante este ciclo.
Ya tienes el marco de trabajo. Abre tu producto, encuentra una función de memoria que infrinja alguno de los cinco principios y corrígela esta semana.
La memoria no es un problema de configuración. Es un problema de relaciones disfrazado de almacenamiento. Cada entrada de memoria es una pequeña afirmación que tu producto hace sobre quién es el usuario, y esa afirmación coincide con la autoimagen del usuario o choca con ella.
Los equipos que ganen este ciclo gestionarán la memoria con la misma dedicación con la que gestionan la búsqueda o la incorporación de usuarios. Un responsable dedicado, revisiones semanales de qué se almacenó y por qué, métricas reales sobre la precisión de la memoria y la confianza del usuario. No una tarea secundaria para un ingeniero de backend.
Si tu hoja de ruta no incluye trabajo relacionado con la memoria para el próximo trimestre, la hoja de ruta está equivocada. Abre el documento, añade el trabajo y asigna un responsable. El tiempo para adelantarse se está agotando.
Need a designer who actually understands AI products? Hire Brainy to design your memory layer.
Get Started

