ai for designersMay 9, 202612 min read

Concevoir la mémoire des agents : le manuel du concepteur de 2026

La mémoire des agents est la nouvelle surface de conception de l'IA que personne n'enseigne. Développez des fonctionnalités de mémoire auxquelles les utilisateurs font réellement confiance grâce à 4 types, 5 principes de confiance et un atelier.

By Boone

X LinkedIn

Votre produit d'IA mémorise désormais des informations. Vous n'avez pas conçu cette fonctionnalité, n'est-ce pas ?

La plupart des équipes ont déployé la mémoire en 2025 et 2026 de la même manière qu'elles ont déployé les notifications en 2012 : en l'activant, en observant la colère des utilisateurs et en corrigeant les problèmes les plus importants. C'est le meilleur moyen de créer un produit vite oublié. C'est aussi le pire moyen de gagner la confiance des utilisateurs quant à la confidentialité de leur travail, de leurs préférences et des petits détails embarrassants qui donnent à l'agent l'impression de les connaître.

Voici le guide du concepteur pour la mémoire des agents. Lisez-le une fois, puis corrigez votre produit.

Qu'est-ce que la mémoire des agents ?

La mémoire des agents désigne tout ce que votre produit retient d'un utilisateur au fil des sessions et utilise pour adapter son comportement futur. Voilà la définition complète. Le mot clé est « utilise pour adapter », car un stockage sans modification du comportement n'est qu'une base de données, et une base de données n'est pas un problème de conception.

Un historique de conversation n'est pas de la mémoire. Une liste de préférences que le modèle intègre silencieusement à chaque invite, en revanche, est de la mémoire. La mémoire est un espace de stockage vectoriel des conversations passées que l'agent consulte lorsque cela est pertinent. Le contexte de projet épinglé dans Claude ou les instructions personnalisées dans une table de prototypage rapide (GPT) sont également de la mémoire, mais avec des formats et des durées de vie différents.

Les concepteurs doivent prêter attention à trois propriétés de toute fonctionnalité de mémoire : ce qui est stocké, quand c'est utilisé et qui peut y accéder et le modifier. Si votre produit est imprécis sur l'un de ces trois points, vos utilisateurs le seront aussi, et des utilisateurs imprécis se méfient du produit qu'ils utilisent.

Pourquoi la mémoire s'est imposée dans l'UX grand public en 2025 et 2026

Trois facteurs ont convergé. ChatGPT a généralisé la mémoire début 2025, Claude a déployé des projets avec un contexte persistant peu après, et le coût de gestion des fenêtres de contexte longues a enfin suffisamment baissé pour que « tout mémoriser » cesse d'être une blague et devienne une stratégie produit. Fin 2025, la mémoire était devenue une option standard lors du lancement de produits d'IA.

Les attentes des utilisateurs ont rapidement évolué. Ceux qui utilisent quotidiennement Claude, ChatGPT, Cursor et Granola s'attendent désormais à ce que tout nouvel outil d'IA se souvienne de leurs informations. Ils s'agacent lorsqu'il se trompe et sont déconcertés lorsqu'il se souvient de choses qu'ils n'avaient pas conscience de lui avoir communiquées.

L'offre de produits dotés de fonctionnalités de mémorisation a explosé. En revanche, celle de produits bien conçus en matière de mémorisation reste quasi inexistante. C'est là que réside l'opportunité.

Les quatre types de mémoire que tout concepteur devrait connaître

La plupart des équipes considèrent la mémoire comme un ensemble homogène. C'est une première erreur. Il existe quatre types distincts, chacun avec ses propres exigences en matière de stockage, d'affichage et de confiance.

Quatre cartes voxel étiquetées avec les mentions PRÉFÉRENCES, INFORMATIONS UTILISATEUR, TRAVAIL EN COURS, SIGNAUX COMPORTEMENTAUX, palette de couleurs pastel douces, fond de studio sombre

Les préférences correspondent aux choix exprimés par l'utilisateur concernant le comportement de l'agent : ton, format, longueur, langue, éléments à ignorer, éléments à toujours inclure. Ces préférences sont explicites, stables et reposent sur un haut niveau de confiance. Les utilisateurs souhaitent configurer ces paramètres une fois pour toutes.

Les informations utilisateur concernent l'utilisateur en tant que personne : nom, rôle, entreprise, projets en cours, outils utilisés, et même le nom de ses enfants s'il les a mentionnés. Ces informations s'accumulent rapidement et deviennent très personnelles. Les utilisateurs veulent les consulter, les modifier et supprimer les plus inappropriées.

Le contexte de travail en cours englobe tout ce qui est lié à une tâche spécifique : le brief marketing d'hier, le document sur lequel l'utilisateur travaille, les données saisies mardi dernier. Ces éléments sont précieux pendant la phase de travail, mais deviennent superflus par la suite. Le défi de conception consiste à déterminer à quel moment ils cessent d'être utiles.

Les signaux comportementaux sont des schémas déduits que l'agent utilise pour prédire les actions à entreprendre. L'utilisateur souhaite systématiquement du code dans TypeScript, il rejette systématiquement les trois premières propositions de logo et il est plus rapide à 21 h qu'à 9 h. Ces signaux sont à la fois les plus utiles et les plus discrets, ce qui les rend particulièrement dangereux.

Les cinq principes de confiance pour la conception de la mémoire

Il existe cinq principes. En négliger un seul, c'est risquer de voir votre fonctionnalité de mémoire faire l'objet d'une capture d'écran et d'une publication par un utilisateur mécontent.

Visible. Chaque élément de mémoire utilisé par l'agent doit être accessible en un clic depuis la conversation. Pas dans les paramètres, pas dans la documentation d'aide, pas enfoui au fin fond des menus. Si l'utilisateur doit se demander « comment il le sait », c'est que vous avez déjà perdu.

Modifiable. Chaque entrée de mémoire doit être modifiable en tant que texte et supprimable en un clic. Pas de discours ambigu du type « nous utiliserons cela pour améliorer notre modèle ». L'utilisateur l'a écrite, il en est propriétaire, il peut la supprimer maintenant et c'est définitif.

Périmètre défini. La mémoire doit avoir un périmètre défini : par conversation, par projet, par compte. Une préférence pour les réponses concises dans votre éditeur de code ne doit pas se répercuter sur votre chatbot de thérapie. Le périmètre est l'élément que la plupart des produits négligent, et c'est cette lacune qui détruit la confiance le plus rapidement.

Expiration. La mémoire doit avoir une durée de vie, déclarée par l'utilisateur ou déduite par le système. Le contexte de travail en cours doit être supprimé lors de la livraison du travail. Les signaux de comportement doivent disparaître si le comportement change. Une mémoire qui persiste indéfiniment devient une source lente de fuite de données obsolètes, corrompant toutes les réponses futures.

Exportation. Les utilisateurs doivent pouvoir exporter leur mémoire dans un format lisible et l'utiliser ailleurs. JSON, Markdown, texte brut : à vous de choisir. Ce principe en confirme tous les autres, car rien n'impose mieux la clarté que de devoir consigner par écrit sa couche de mémoire pour qu'elle soit lisible par un tiers.

ChatGPT La mémoire et le problème des mises à jour silencieuses

ChatGPT La mémoire est la fonctionnalité de mémoire la plus utilisée au monde. C'est aussi celle qui illustre le plus clairement ce qui se passe lorsqu'on maîtrise quelques principes et qu'on en néglige d'autres.

Cinq cartes voxel étiquetées VISIBLE, MODIFIABLE, LIMITÉE, EXPIRABLE, EXPORTABLE disposées sur un tableau, fond de studio sombre, palette de couleurs pastel douces

La partie visible est correcte. Il y a un tiroir de mémoire ; on peut l'ouvrir et consulter les entrées. La partie modifiable fonctionne : on peut supprimer une entrée et elle disparaît définitivement. Jusque-là, tout va bien.

Le problème, ce sont les mises à jour silencieuses. ChatGPT enregistre de nouvelles entrées de mémoire pendant les conversations normales sans demander l'autorisation, et le seul signal est une petite notification « Mémoire mise à jour » qui disparaît au bout de deux secondes. Les utilisateurs découvrent régulièrement des mois d'informations accumulées qu'ils n'ont jamais explicitement approuvées, y compris des interprétations erronées et des détails embarrassants issus d'une simple conversation. Ce comportement par défaut crée la surprise, et la surprise est l'antithèse de la confiance.

La solution serait d'afficher une brève demande d'autorisation lors des dix premiers enregistrements de mémoire, ainsi qu'un récapitulatif hebdomadaire des ajouts depuis la dernière consultation. Or, ces deux éléments n'existent pas. Il s'agit d'un choix de conception, et non d'une limitation technique.

La mémoire Claude dans les projets : ses points forts

L'approche de Claude est l'inverse de celle de ChatGPT. Dans Claude, la mémoire est principalement gérée par les projets, des conteneurs créés par l'utilisateur avec des instructions précises et des fichiers importés. L'utilisateur crée le projet, le nomme et le contextualise. L'utilisation de la mémoire est optionnelle par conception.

Ceci résout élégamment le problème de la délimitation des projets. Votre projet « Stratégie marketing » n'interfère pas avec votre projet « Journal de thérapie », car ce sont des conteneurs distincts avec des contextes différents. L'utilisateur comprend les limites puisqu'il les a définies lui-même.

En contrepartie, Claude est moins performant. L'absence de mémorisation automatique des préférences entre les projets peut entraîner des répétitions. Les nouvelles fonctionnalités de mémoire de Claude commencent à combler cette lacune, mais la leçon de conception est déjà claire : les délimitations définies par l'utilisateur inspirent davantage confiance que celles déduites par le système, même si cela implique un léger désagrément en termes de praticité.

Règles de curseur, le modèle .cursorrules et la mémoire en tant que code

Cursor utilise un modèle totalement différent. Les règles du projet résident dans un fichier du dépôt nommé .cursorrules ou .cursor/rules/. Les développeurs rédigent les règles en texte brut, les enregistrent dans Git, et l'agent les lit à chaque interaction.

C'est le principe de la mémoire en tant que code. Ce modèle remplit naturellement toutes les conditions des principes de confiance, car les fichiers texte d'un dépôt sont, par définition, visibles, modifiables, limités à une portée et exportables. Son seul point faible est l'expiration, que le développeur doit gérer en modifiant le fichier.

La leçon à retenir pour les produits destinés aux non-développeurs n'est pas de « fournir un fichier de configuration ». La leçon est qu'une mémoire accessible comme un document unique inspire davantage confiance qu'une mémoire accessible via une interface utilisateur. Lors de la conception d'un tiroir de mémoire, il est préférable de concevoir d'abord l'interface du document, puis l'éditeur par-dessus.

Granola, les instructions GPT personnalisées et la longue traîne des formats de mémoire

Granola, l'outil de prise de notes en réunion, considère chaque bloc-notes comme un contexte unique. L'agent lit le contenu du bloc-notes pour rédiger de nouvelles notes. Il n'existe pas de mémoire globale de l'utilisateur. Le format est « la mémoire est ce qui se trouve dans la salle », ce qui fonctionne car les réunions sont par nature limitées.

Les instructions GPT personnalisées représentent le format de mémoire le plus ancien de l'ère de l'IA moderne. Le créateur rédige une invite système, l'utilisateur choisit le GPT, et l'invite formate chaque réponse. Ce système est fragile, non adaptable, et reste le mécanisme de mémoire le plus utilisé en termes de volume brut, car il est extrêmement simple et parfaitement lisible.

Le point commun à tous ces systèmes est que les meilleures conceptions de mémoire placent l'utilisateur au cœur de la mémoire. Les pires, au contraire, font du système l'auteur et de l'utilisateur le destinataire.

Quatre cartes voxel intitulées THE CREEP, THE SURPRISE, THE LOCK-IN, THE MEMORY TOLE sur un fond de studio sombre, palette de couleurs pastel douces

Les quatre modes de défaillance à anticiper

Chaque fonctionnalité de mémoire présente quatre modes de défaillance. Identifiez-les, surveillez-les et éliminez-les lors de la revue de conception.

L'accumulation. La mémoire s'accumule plus vite que l'utilisateur ne peut la gérer. Après trois mois, il se retrouve avec 400 entrées, dont la moitié sont erronées ou obsolètes, sans moyen réaliste de les nettoyer. Pour y remédier, utilisez des limites, des minuteurs de suppression et des outils de suppression en masse.

La surprise. L'agent utilise une mémoire dont l'utilisateur ignorait l'existence, ce qui donne à ce dernier l'impression d'être surveillé. Pour y remédier, informez-le proactivement, ajoutez une option « Pourquoi avez-vous dit cela ? » à chaque réponse et demandez une confirmation explicite lors de la première utilisation d'une entrée.

La dépendance. L'utilisateur ne peut pas quitter le produit car sa mémoire y est stockée. Pour y remédier, proposez une exportation en un clic vers un format portable, sans inscription à un e-mail marketing ni création de ticket d'assistance.

Le trou dans la mémoire. L'agent oublie l'information dont l'utilisateur a le plus besoin. Il répète le même contexte cinq fois et change de produit. Pour y remédier, utilisez un système d'épinglage explicite, un bouton « Se souvenir de ceci » fonctionnel et un outil de vérification de la mémoire qui confirme la présence de l'entrée.

Choisissez la catégorie à laquelle votre produit se rapproche le plus actuellement. Ce sera votre feuille de route pour le prochain trimestre.

Le vocabulaire de conception des fonctionnalités de mémoire

On ne peut concevoir ce qu'on ne nomme pas. Voici le vocabulaire de travail sur lequel convergent les meilleures équipes, avec des définitions dont vous pouvez vous inspirer.

Une fiche mémoire est l'unité de base de la mémoire stockée. Une fiche, un fait ou une préférence, un horodatage, une portée, une source. Affichez les fiches comme vous affichez les messages, avec des interactions cohérentes sur chacune d'elles.

Une puce de portée est une petite pastille qui déclare la portée d'un souvenir ou d'une session : « Cette conversation », « Ce projet », « Tout votre travail », « Tout ». Les puces de portée sont placées sur les fiches mémoire, dans les conversations et dans les réponses de l'agent lorsqu'il cite un souvenir.

Un compte à rebours est un indicateur de durée de conservation visible sur une entrée de mémoire : « Expire dans 14 jours », « Conservé jusqu'à la clôture du projet », « Permanent ». Les minuteurs de dégradation transforment la notion abstraite d'expiration en une fonctionnalité visible et modifiable par l'utilisateur.

Un journal d'audit enregistre les actions de l'agent et leurs raisons, notamment les mémoires utilisées pour chaque réponse. Rendez cette fonctionnalité accessible en un clic depuis chaque message. Le premier produit à maîtriser les journaux d'audit pour les réponses d'IA dominera le marché de la confiance pour la prochaine décennie.

Un inspecteur de mémoire offre une vue plein écran de toutes les mémoires stockées, organisées par portée, filtrables par source et triables par date. C'est l'écran le plus important de votre produit d'IA, et pourtant, la plupart des produits en sont dépourvus.

Atelier de conception de fonctionnalités de mémoire

Voici un atelier en six étapes, réalisable en un après-midi, pour concevoir une fonctionnalité de mémoire de A à Z. Réunissez un concepteur, un chef de produit et un ingénieur connaissant la couche modèle.

Espace de travail d'un concepteur voxel avec cartes mémoire disposées, journal d'audit visible, puces d'oscilloscope sur un tableau, palette de couleurs pastel douces, fond de studio sombre

Listez les quatre types de mémoire pour votre produit. Rédigez une phrase par type décrivant ce que votre agent doit mémoriser. Si un type ne s'applique pas, supprimez-le explicitement. 2. Dessinez l'inspecteur de mémoire. Uniquement l'inspecteur, sans autres écrans. À quoi ressemble une carte mémoire ? Quels filtres existent ? Que peut supprimer, modifier, épingler ou exporter l'utilisateur ?
Déterminez la portée par défaut de chaque type : par conversation, par projet ou globale. Justifiez votre choix en une phrase. Si vous ne pouvez pas le justifier, la valeur par défaut est inappropriée.
Définissez la politique d'expiration de chaque type : durée fixe, événement lié comme la fermeture du projet ou expiration permanente jusqu'à suppression par l'utilisateur. Aucun type ne doit être ambigu.
Concevez la communication des informations. Comment l'utilisateur est-il informé de l'enregistrement, de l'utilisation et de la mise à jour des données ? Précisez les notifications, les badges, les citations intégrées et les récapitulatifs hebdomadaires.
Rédigez le format d'exportation. Ouvrez un éditeur de texte et rédigez le code JSON ou Markdown que votre bouton d'exportation générera pour un utilisateur intensif avec 200 entrées de mémoire. Si le code ressemble à une extraction de données, repensez-le pour qu'il ressemble à des notes.

C'est le principe de l'atelier. Lancez-le avant même d'écrire votre première ligne de code de gestion de la mémoire, puis relancez-le après le lancement, une fois que vous aurez identifié les usages réels des utilisateurs.

Comparaison rapide des principaux produits

Voici un tableau de bord des produits les plus utilisés par les équipes aujourd'hui. Les résultats peuvent varier au fil des mises à jour, mais la répartition des points forts et des points faibles reste stable.

|---|---|---|---|---|---|

| ChatGPT Mémoire | Partielle | Oui | Faible | Non | Non |

| Règles de curseur | Oui | Oui | Forte | Manuelle | Oui |

| Carnets Granola | Oui | Oui | Forte | N/A | Partielle |

| Instructions GPT personnalisées | Oui | Oui | Robuste | Manuel | Oui |

La tendance est claire. Les produits qui permettent à l'utilisateur de créer le conteneur obtiennent les meilleurs scores en termes de portée et d'exportabilité, mais au détriment de la simplicité d'utilisation. Les produits qui automatisent la gestion de la mémoire privilégient la simplicité d'utilisation, mais au détriment de la confiance. Aucun produit n'a encore véritablement résolu ces deux problèmes, ce qui explique pourquoi ce domaine reste un vaste champ d'exploration.

Ce que cela signifie pour les deux à trois prochaines années

Trois prédictions, toutes suffisamment fiables pour être prises au sérieux.

Les inspecteurs de mémoire deviendront une interface standard. D'ici 18 mois, chaque produit d'IA sérieux disposera d'un écran de mémoire dédié, et la qualité de cet écran figurera parmi les trois principaux critères de choix des utilisateurs. Commencez à concevoir le vôtre dès maintenant.

Les principes de confiance seront réglementés. La visibilité, la possibilité de modifier et d'exporter la mémoire de l'IA seront intégrées au droit de la protection des données, probablement d'abord dans l'UE, puis plus largement d'ici 2028. Les produits qui les considèrent comme des fonctionnalités et non comme une simple obligation de conformité domineront le segment haut de gamme.

La mémoire devient l'emblème de la marque. La fidélité des utilisateurs à un produit d'IA plutôt qu'à un autre ne reposera plus sur la qualité du modèle, mais sur la capacité du produit à se souvenir d'eux. Le modèle est une marchandise, la mémoire est le rempart. Les concepteurs qui maîtrisent cet atout pour leurs produits seront les atouts les plus précieux des équipes d'IA durant ce cycle.

Vous disposez désormais du cadre. Ouvrez votre produit, trouvez une fonctionnalité de mémoire qui enfreint l'un des cinq principes et corrigez-la cette semaine.

La mémoire n'est pas un problème de paramètres. C'est un problème relationnel, une question de stockage. Chaque entrée en mémoire est une petite affirmation de votre produit sur l'utilisateur, et cette affirmation correspond à l'image que l'utilisateur a de lui-même ou la contredit.

Les équipes qui réussiront ce cycle consacreront la gestion de la mémoire au même titre que la recherche ou l'intégration. Un responsable dédié, des revues hebdomadaires des données stockées et de leur utilité, des indicateurs précis sur la fiabilité de la mémoire et la confiance des utilisateurs. Ce n'est pas une tâche secondaire pour un ingénieur backend.

Si votre feuille de route n'intègre pas le travail sur la mémoire pour le prochain trimestre, elle est erronée. Ouvrez le document, ajoutez le travail, désignez le propriétaire. Il est grand temps d'agir au plus vite.

Need a designer who actually understands AI products? Hire Brainy to design your memory layer.

Get Started