ai for designersMay 9, 202612 min read

Gestaltung von Agentenspeicher: Das Designerhandbuch 2026

Agentengedächtnis ist die neue KI-Designoberfläche, die niemand lehrt. Entwickeln Sie Gedächtnisfunktionen, denen Benutzer tatsächlich vertrauen – mit 4 Typen, 5 Vertrauensprinzipien und einem Workshop.

By Boone
XLinkedIn
designing agent memory

Ihr KI-Produkt merkt sich jetzt Dinge. Das haben Sie nicht geplant, oder?

Die meisten Teams haben die Speicherfunktion 2025 und 2026 genauso eingeführt wie die Benachrichtigungen 2012: Sie haben sie aktiviert, die Nutzer verärgert beobachtet und die schlimmsten Beschwerden behoben. So entsteht ein Produkt, das schnell in Vergessenheit gerät. Es ist aber der denkbar schlechteste Weg, das Vertrauen der Nutzer zu gewinnen – sei es in Bezug auf ihre Arbeit, ihre Präferenzen oder die kleinen, peinlichen Details, die einem Agenten das Gefühl geben, sie zu kennen.

Dies ist das Handbuch für Entwickler von Agentenspeicherfunktionen. Lesen Sie es einmal und verbessern Sie dann Ihr Produkt.

Was Agentenspeicher eigentlich ist

Agentenspeicher ist alles, was Ihr Produkt über einen Nutzer sitzungsübergreifend speichert und nutzt, um sein zukünftiges Verhalten anzupassen. Das ist die vollständige Definition. Der Schlüsselbegriff ist „nutzt, um zu ändern“, denn Speicherung ohne Verhaltensänderung ist lediglich eine Datenbank, und eine Datenbank ist kein Designproblem.

Ein Chatverlauf ist kein Speicher. Eine Liste von Präferenzen, die das Modell stillschweigend in jede Eingabeaufforderung einfügt, ist Speicher. Ein Vektorspeicher vergangener Konversationen, den der Agent bei Bedarf durchsucht, ist der Speicher. Der fixierte Projektkontext in Claude oder die benutzerdefinierten Anweisungen in einem GPT sind ebenfalls Speicher, nur mit anderer Struktur und Lebensdauer.

Designer sollten drei Eigenschaften jeder Speicherfunktion beachten: Was wird gespeichert, wann wird es verwendet und wer kann es einsehen und ändern? Wenn Ihr Produkt in einem dieser drei Punkte unklar ist, werden es Ihre Nutzer auch sein, und unschlüssige Nutzer vertrauen dem, was sie verwenden.

Warum Speicher 2025 und 2026 zum Mainstream-UX wurde

Drei Dinge trafen zusammen: ChatGPT führte Anfang 2025 Speicher für alle ein, Claude rollte kurz darauf Projekte mit persistentem Kontext aus, und die Kosten für lange Kontextfenster sanken endlich so weit, dass „einfach alles merken“ nicht mehr nur ein Witz war, sondern zur Produktstrategie wurde. Ende 2025 war Speicher ein Standardmerkmal bei der Einführung von KI-Produkten.

Die Erwartungen der Nutzer folgten schnell. Anwender von Claude, ChatGPT, Cursor und Granola erwarten heute von jedem neuen KI-Tool, dass es sich an sie erinnert. Sie sind verärgert, wenn es sich falsch erinnert, und verunsichert, wenn es sich an Dinge erinnert, die sie ihm mitgeteilt hatten, ohne es zu wissen.

Das Angebot an Produkten mit Speicherfunktionen ist explosionsartig gestiegen. Das Angebot an Produkten mit gutem Speicherdesign ist hingegen nahezu null. Diese Lücke bietet eine Chance.

Die vier Speichertypen, die jeder Designer kennen sollte

Die meisten Teams behandeln Speicher als einen einzigen, undifferenzierten Behälter. Das ist der erste Fehler. Es gibt vier verschiedene Typen, und jeder hat unterschiedliche Anforderungen an Speicherung, Bereitstellung und Vertrauenswürdigkeit.

Vier beschriftete Voxelkarten mit den Aufschriften PRÄFERENZEN, BENUTZERFAKTEN, IN BEARBEITUNG, VERHALTENSSIGNALE, sanfte Pastellfarben, dunkler Studiohintergrund
Vier beschriftete Voxelkarten mit den Aufschriften PRÄFERENZEN, BENUTZERFAKTEN, IN BEARBEITUNG, VERHALTENSSIGNALE, sanfte Pastellfarben, dunkler Studiohintergrund

Präferenzen sind die vom Nutzer festgelegten Einstellungen zum Verhalten des Agenten. Tonfall, Format, Länge, Sprache, was übersprungen werden soll, was immer enthalten sein soll. Diese Einstellungen sind explizit, ändern sich langsam und erfordern hohes Vertrauen. Nutzer möchten diese einmal festlegen und dann vergessen.

Nutzerfakten sind Informationen über den Nutzer als Person. Name, Rolle, Unternehmen, Projekte, an denen er arbeitet, verwendete Tools, die Namen seiner Kinder, falls diese erwähnt wurden. Diese Daten sammeln sich schnell an und wirken intim. Nutzer möchten sie einsehen, bearbeiten und unpassende Einträge löschen.

Arbeitskontext umfasst alles, was mit einer bestimmten Aufgabe zusammenhängt. Das Markenbriefing von gestern, das Dokument, an dem der Nutzer gerade arbeitet, die Daten, die er letzten Dienstag eingefügt hat. Während der Arbeit ist dies sehr wertvoll, danach jedoch irrelevant. Die Designherausforderung besteht darin, zu erkennen, wann diese Informationen an Bedeutung verlieren.

Verhaltenssignale sind abgeleitete Muster, anhand derer der Agent sein weiteres Vorgehen vorhersagt. Der Nutzer wünscht sich immer Code in TypeScript, er lehnt immer die ersten drei Logo-Entwürfe ab, er ist um 21 Uhr schneller als um 9 Uhr morgens. Diese Informationen sind am nützlichsten und gleichzeitig am unauffälligsten – und genau diese Kombination macht sie am gefährlichsten.

Die fünf Vertrauensprinzipien für das Speicherdesign

Es gibt fünf Prinzipien. Wenn Sie auch nur eine dieser Funktionen außer Acht lassen, wird Ihre Speicherfunktion zu einem Sicherheitsrisiko, das nur darauf wartet, von einem verärgerten Nutzer per Screenshot festgehalten und veröffentlicht zu werden.

Sichtbar. Jeder Speichereintrag, den der Agent verwendet, muss mit einem Klick aus der Konversation heraus auffindbar sein. Nicht in den Einstellungen, nicht in der Hilfedokumentation, nicht tief in Menüs versteckt. Wenn der Nutzer fragen muss: „Woher weiß das der Agent das?“, haben Sie bereits verloren.

Bearbeitbar. Jeder Speichereintrag muss als Text bearbeitbar und mit einem Klick löschbar sein. Keine Ausflüchte wie „Wir verwenden das, um unser Modell zu verbessern“. Der Nutzer hat es geschrieben, der Nutzer ist der Eigentümer, der Nutzer kann es jetzt löschen, und es ist weg.

Gültig definiert. Der Speicher muss einen definierten Gültigkeitsbereich haben. Pro Konversation, pro Projekt, pro Konto. Ihre Vorliebe für knappe Antworten in Ihrem Code-Editor sollte sich nicht auf Ihren Therapie-Chatbot auswirken. Die Gültigkeitsdefinition ist der Punkt, an dem die meisten Produkte Fehler machen, und genau dieser Fehler zerstört das Vertrauen am schnellsten.

Ablauffähig. Der Speicher muss eine Lebensdauer haben, die entweder vom Benutzer festgelegt oder vom System abgeleitet wird. Der Kontext laufender Arbeiten sollte mit der Auslieferung der Arbeit verfallen. Verhaltenssignale sollten sich mit der Änderung des Verhaltens auflösen. Speicher, der unbegrenzt existiert, führt zu einem schleichenden Datenleck, das jede zukünftige Antwort verfälscht.

Exportierbar. Benutzer müssen ihren Speicher in einem lesbaren Format exportieren und anderweitig verwenden können. JSON, Markdown, Klartext – wählen Sie eines. Dieses Prinzip beweist die anderen, denn nichts erzwingt Klarheit so sehr wie die Notwendigkeit, die eigene Speicherebene für andere verständlich zu machen.

ChatGPT Speicher und das Problem der stillen Aktualisierungen

ChatGPT Der Speicher ist die weltweit am häufigsten genutzte Speicherfunktion. Er zeigt auch am deutlichsten, was passiert, wenn man einige Prinzipien befolgt, andere aber vernachlässigt.

Fünf Voxelkarten mit den Aufschriften SICHTBAR, BEARBEITBAR, BESCHRÄNKBAR, ABLAUFBAR, EXPORTIERBAR sind auf einem Brett angeordnet; dunkler Studiohintergrund, sanfte Pastellfarben.
Fünf Voxelkarten mit den Aufschriften SICHTBAR, BEARBEITBAR, BESCHRÄNKBAR, ABLAUFBAR, EXPORTIERBAR sind auf einem Brett angeordnet; dunkler Studiohintergrund, sanfte Pastellfarben.

Der sichtbare Bereich ist in Ordnung. Es gibt eine Speicherablage, die man öffnen und in der man Einträge sehen kann. Der Bearbeitungsbereich funktioniert; Einträge lassen sich löschen und sind dann unwiderruflich verschwunden. Soweit so gut.

Das Problem sind jedoch die stillen Aktualisierungen. ChatGPT speichert neue Speichereinträge während normaler Konversationen ohne Nachfrage. Die einzige Benachrichtigung ist eine kurze Meldung „Speicher aktualisiert“, die nach zwei Sekunden wieder verschwindet. Nutzer entdecken regelmäßig monatelang angesammelte Informationen, denen sie nie ausdrücklich zugestimmt haben, darunter Fehlinterpretationen und peinliche Details aus einem einmaligen Chat. Dieses Standardverhalten erzeugt Überraschung, und Überraschung ist das Gegenteil von Vertrauen.

Die Lösung wäre eine kurze Berechtigungsabfrage bei den ersten zehn Speichervorgängen sowie eine wöchentliche Zusammenfassung der seit dem letzten Besuch hinzugefügten Daten. Beides existiert nicht. Dies ist eine Designentscheidung, keine technische Einschränkung.

Claude Speicher in Projekten und seine Stärken

Der Ansatz von Claude ist das Gegenteil von dem von ChatGPT. In Claude befindet sich der Speicher größtenteils innerhalb von Projekten. Diese sind vom Benutzer erstellte Container mit expliziten Anweisungen und hochgeladenen Dateien. Der Benutzer erstellt das Projekt, benennt es und füllt es mit Kontext. Der Speicher ist standardmäßig optional.

Dies löst das Problem des Gültigkeitsbereichs elegant. Ihr Projekt „Marketingstrategie“ beeinträchtigt nicht Ihr Projekt „Therapietagebuch“, da es sich um separate Container mit jeweils eigenem Kontext handelt. Der Benutzer versteht die Abgrenzung, da er sie selbst gezogen hat.

Der Nachteil von Claude ist, dass es weniger Funktionen bietet. Es gibt keine automatische Speicherung Ihrer Einstellungen über verschiedene Projekte hinweg, sodass Sie sich wiederholen müssen. Die neueren Speicherfunktionen von Claude beginnen, diese Lücke zu schließen, aber die Designlehre ist bereits klar: Vom Benutzer definierte Gültigkeitsbereiche genießen mehr Vertrauen als systemseitig abgeleitete, selbst wenn sie etwas weniger Komfort bieten.

Cursorregeln, das .cursorrules-Muster und Speicher als Code

Cursor verwendet ein völlig anderes Modell. Projektregeln befinden sich in einer Datei im Repository namens .cursorrules oder .cursor/rules/. Entwickler schreiben die Regeln als Klartext, übertragen sie an Git, und der Agent liest sie bei jeder Interaktion.

Dies ist Speicher als Code. Er erfüllt alle Eigenschaften der Vertrauensprinzipien automatisch, da Textdateien in einem Repository per Definition sichtbar, bearbeitbar, abgrenzbar und exportierbar sind. Die einzige Schwachstelle ist das Ablaufdatum, das der Entwickler durch Bearbeiten der Datei festlegen muss.

Die Lehre für Produkte, die nicht für Entwickler bestimmt sind, lautet nicht: „Liefern Sie eine Konfigurationsdatei aus.“ Die Lehre ist, dass Speicher, der als einzelnes Dokument gelesen werden kann, sicherer wirkt als Speicher, der über eine Benutzeroberfläche abgefragt werden muss. Beim Entwurf eines Speichersystems sollte zuerst die Dokumentenansicht und anschließend der Editor darauf aufgebaut werden.

Granola, benutzerdefinierte GPT-Anweisungen und die Vielfalt der Speicherstrukturen

Granola, das Tool für Besprechungsnotizen, behandelt jedes Notizbuch als eigenen Kontext. Der Agent liest den Inhalt des Notizbuchs, um neue Notizen zu erstellen. Es gibt kein globales Gedächtnis für Sie als Benutzer. Das Prinzip lautet: „Speicher ist das, was gerade im Raum ist.“ Das funktioniert, weil Besprechungen naturgemäß zeitlich begrenzt sind.

Benutzerdefinierte GPT-Anweisungen sind die älteste Speicherform im modernen KI-Zeitalter. Der Entwickler schreibt eine Systemabfrage, der Benutzer wählt die GPT aus, und die Abfrage prägt jede Antwort. Dieses System ist fehleranfällig, passt sich nicht an und ist dennoch der am häufigsten verwendete Speichermechanismus, weil er extrem einfach und leicht verständlich ist.

Allen diesen Systemen ist gemeinsam, dass die besten Speicherdesigns den Benutzer zum Autor des Speichers machen. Die schlechtesten machen das System zum Autor und den Benutzer zum Empfänger.

Vier Voxelkarten mit den Aufschriften „THE CREEP“, „THE SURPRISE“, „THE LOCK-IN“ und „THE MEMORY HOLE“ vor dunklem Studiohintergrund, sanfte Pastellfarben
Vier Voxelkarten mit den Aufschriften „THE CREEP“, „THE SURPRISE“, „THE LOCK-IN“ und „THE MEMORY HOLE“ vor dunklem Studiohintergrund, sanfte Pastellfarben

Die vier Fehlerquellen, gegen die Sie vorgehen müssen

Jede Speicherfunktion kann auf eine von vier Arten versagen. Benennen Sie diese, achten Sie auf sie und beseitigen Sie sie in der Designprüfung.

Die schleichende Zunahme. Der Speicher wächst schneller, als der Benutzer ihn verwalten kann. Nach drei Monaten hat der Benutzer 400 Einträge, von denen die Hälfte falsch oder veraltet ist, und es gibt keine realistische Möglichkeit, sie zu bereinigen. Beheben Sie dieses Problem mit Großbuchstaben, Ablaufzeiten und Werkzeugen zum Massenlöschen.

Die Überraschung: Der Agent nutzt Speicher, von dem der Benutzer nichts wusste, und der Benutzer fühlt sich überwacht. Beheben Sie dies mit proaktiver Offenlegung, einer „Warum haben Sie das gesagt?“-Funktion bei jeder Antwort und einer expliziten Bestätigung bei der ersten Verwendung eines Speichers.

Die Abhängigkeit: Der Benutzer kann nicht wechseln, da sein Speicher in Ihrem Produkt gefangen ist. Beheben Sie dies mit einem Ein-Klick-Export in ein portables Format, ohne Marketing-E-Mail-Beschränkung und ohne Support-Ticket.

Das Speicherloch: Der Agent vergisst genau das, was der Benutzer am dringendsten benötigt. Der Benutzer wiederholt denselben Kontext fünfmal und wechselt das Produkt. Beheben Sie dies mit explizitem Anheften, einer funktionierenden „Merken“-Schaltfläche und einer Speicherprüfung, die den Eintrag bestätigt.

Wählen Sie aus, welcher dieser Lösungen Ihr Produkt derzeit am ehesten entspricht. Das ist Ihr Fahrplan für das nächste Quartal.

Designvokabular für Speicherfunktionen

Was man nicht benennen kann, kann man nicht designen. Hier ist das Arbeitsvokabular, auf das sich die besten Teams einigen, mit Definitionen, die Sie übernehmen können.

Eine Speicherkarte ist die kleinste Einheit gespeicherter Daten. Eine Karte, eine Information oder Präferenz, ein Zeitstempel, ein Bereich, eine Quelle. Zeigen Sie Karten wie Nachrichten an, mit einheitlichen Funktionen für jede Karte.

Ein Bereichschip ist ein kleines Symbol, das den Bereich eines Speichers oder einer Sitzung festlegt. „Diese Konversation“, „Dieses Projekt“, „Ihre gesamte Arbeit“, „Alles“. Bereichschips werden auf Speicherkarten, in Konversationen und in den Antworten des Agenten platziert, wenn dieser auf den Speicher zugreift.

Ein Ablauf-Timer ist ein sichtbarer Countdown oder eine Ablaufanzeige für einen Speichereintrag. „Läuft in 14 Tagen ab“, „Wird bis zum Projektabschluss aufbewahrt“, „Permanent“. Ablauftimer machen das abstrakte Konzept des Ablaufs für den Benutzer sichtbar und veränderbar.

Ein Audit-Trail protokolliert die Aktionen des Agenten und deren Gründe, einschließlich der verwendeten Speicherbereiche in jeder Antwort. Stellen Sie diese Funktion für jede Nachricht mit einem Klick bereit. Das erste Produkt, das Audit-Trails für KI-Antworten überzeugend umsetzt, wird den Markt für das Vertrauen der Nutzer im nächsten Jahrzehnt dominieren.

Ein Speicherinspektor bietet eine Vollbildansicht aller gespeicherten Daten, organisiert nach Gültigkeitsbereich, filterbar nach Quelle und sortierbar nach Aktualität. Dies ist die wichtigste Ansicht Ihres KI-Produkts, und die meisten Produkte verfügen nicht darüber.

Workshop zur Entwicklung von Speicherfunktionen

Hier ist ein sechsstufiger Workshop, den Sie an einem Nachmittag durchführen können, um eine Speicherfunktion von Grund auf zu entwickeln. Bringen Sie einen Designer, einen Produktmanager und einen Entwickler mit, der sich mit der Modellschicht auskennt.

Arbeitsbereich eines Voxel-Designers mit ausgelegten Speicherkarten, sichtbarem Prüfprotokoll, Oszilloskop-Chips auf einer Platine, sanfter Pastellpalette und dunklem Studiohintergrund.
Arbeitsbereich eines Voxel-Designers mit ausgelegten Speicherkarten, sichtbarem Prüfprotokoll, Oszilloskop-Chips auf einer Platine, sanfter Pastellpalette und dunklem Studiohintergrund.
  1. Listen Sie die vier Speichertypen für Ihr Produkt auf. Beschreiben Sie in einem Satz pro Typ, was Ihr Agent in diesem Bereich speichern soll. Falls ein Typ nicht zutrifft, entfernen Sie ihn explizit.

  2. Zeichnen Sie die Speicherinspektion. Nur die Inspektion, keine weiteren Ansichten. Wie sieht eine einzelne Speicherkarte aus, welche Filter gibt es, was kann der Benutzer löschen, bearbeiten, anheften oder exportieren?

  3. Legen Sie den Standardbereich für jeden Typ fest: pro Konversation, pro Projekt oder global. Begründen Sie Ihre Wahl jeweils in einem Satz. Wenn Sie sie nicht begründen können, ist der Standardwert falsch.

  4. Legen Sie die Ablaufrichtlinie für jeden Typ fest: entweder eine feste Dauer, ein Ereignis wie „Projektabschluss“ oder „dauerhaft bis zur Löschung durch den Benutzer“. Kein Typ darf mehrdeutig sein.

  5. Gestalten Sie die Transparenz. Wie erfährt der Benutzer, wann Speicher belegt, verwendet und aktualisiert wird? Beschreiben Sie Benachrichtigungen, Badges, Inline-Zitate und wöchentliche Zusammenfassungen.

  6. Schreiben Sie das Exportformat. Öffnen Sie einen Texteditor und schreiben Sie das JSON- oder Markdown-Format, das Ihr Exportbutton für einen Vielnutzer mit 200 Speichereinträgen erzeugt. Wenn es sich wie ein Datenbankauszug liest, überarbeiten Sie es so lange, bis es wie Notizen aussieht.

Das ist der Workshop. Führen Sie ihn durch, bevor Sie Ihre erste Zeile Speichercode schreiben, und erneut nach dem Launch, wenn Sie wissen, was die Nutzer tatsächlich verwenden.

Ein kurzer Vergleich der wichtigsten Produkte

Hier ist die Übersicht der Produkte, die die meisten Teams heute verwenden. Ihre Ergebnisse können mit den Updates variieren, aber das Muster der Stärken und Schwächen bleibt stabil.

| Produkt | Sichtbar | Bearbeitbar | Bereich | Ablaufdatum | Exportierbar |

|---|---|---|---|---|---|

| ChatGPT Speicher | Teilweise | Ja | Schwach | Nein | Nein |

| Claude Projekte | Ja | Ja | Stark | Manuell | Teilweise |

| Cursorregeln | Ja | Ja | Stark | Manuell | Ja |

| Granola-Notizbücher | Ja | Ja | Stark | Nicht verfügbar | Teilweise |

| Benutzerdefinierte GPT-Anweisungen | Ja | Ja | Stark | Manuell | Ja |

Das Muster ist eindeutig. Produkte, die es dem Benutzer ermöglichen, den Container selbst zu erstellen, erzielen die höchsten Werte hinsichtlich Umfang und Exportierbarkeit, allerdings auf Kosten des Komforts. Produkte, die die Speicherverwaltung automatisieren, erzielen den höchsten Komfort, gewinnen aber an Vertrauen. Bisher gibt es kein Produkt, das beide Aspekte vollständig abdeckt. Daher bietet dieser Bereich noch viel Entwicklungspotenzial.

Was das für die nächsten zwei bis drei Jahre bedeutet

Drei Prognosen, auf die man mit großer Wahrscheinlichkeit setzen kann.

Speicherinspektoren werden zum Standard. Innerhalb von 18 Monaten wird jedes ernstzunehmende KI-Produkt über eine dedizierte Speicherüberwachung verfügen. Die Qualität dieser Überwachung wird einer der drei wichtigsten Gründe für die Produktwahl sein. Beginnen Sie jetzt mit der Entwicklung Ihrer eigenen.

Die Vertrauensprinzipien werden reguliert. Transparenz, Bearbeitbarkeit und Exportierbarkeit des KI-Speichers werden im Datenschutzrecht Berücksichtigung finden, voraussichtlich zuerst in der EU, bis 2028 voraussichtlich flächendeckend. Produkte, die diese Aspekte als Funktionen und nicht als bloße Compliance-Maßnahmen behandeln, werden das Segment der Produkte mit hohem Vertrauen dominieren.

Speicher wird zum Markenzeichen. Der Grund, warum Nutzer einem KI-Produkt treu bleiben, hängt nicht mehr von der Modellqualität ab, sondern davon, wie gut sich das Produkt an sie erinnert. Das Modell ist austauschbar, der Speicher der Wettbewerbsvorteil. Entwickler, die diesen Wettbewerbsvorteil für ihre Produkte sichern, werden in diesem Zyklus die wertvollsten Mitarbeiter in KI-Teams sein.

Sie haben nun das Framework. Öffnen Sie Ihr Produkt, finden Sie eine Speicherfunktion, die gegen eines der fünf Prinzipien verstößt, und beheben Sie sie noch diese Woche.

Speicher ist kein Einstellungsproblem. Es ist ein Beziehungsproblem, das sich hinter der Speicherung verbirgt. Jeder Speichereintrag ist eine kleine Aussage Ihres Produkts darüber, wer der Nutzer ist, und diese Aussage entspricht entweder dem Selbstbild des Nutzers oder widerspricht ihm.

Die Teams, die in diesem Zyklus erfolgreich sind, werden dem Speichermanagement genauso viel Aufmerksamkeit widmen wie der Suche oder dem Onboarding. Ein dedizierter Verantwortlicher, wöchentliche Überprüfungen der gespeicherten Daten und deren Gründe, aussagekräftige Kennzahlen zur Speichergenauigkeit und zum Nutzervertrauen. Keine Nebenaufgabe für einen Backend-Entwickler.

Wenn Ihre Roadmap für das nächste Quartal keine Speicherverwaltung vorsieht, ist die Roadmap fehlerhaft. Öffnen Sie das Dokument, fügen Sie die Arbeit hinzu und weisen Sie den Verantwortlichen zu. Die Frist für eine frühzeitige Bearbeitung läuft schnell ab.

Need a designer who actually understands AI products? Hire Brainy to design your memory layer.

Get Started

More from Brainy Papers

Keep reading