ai for designersMay 9, 202612 min read

Разработка памяти для агентов: Справочник разработчика 2026 года

Память агентов — это новая область проектирования ИИ, которой никто не обучает. Создавайте функции памяти, которым пользователи действительно доверяют, используя 4 типа, 5 принципов доверия, а также проведя мастер-класс.

By Boone

X LinkedIn

Ваш продукт на основе ИИ теперь запоминает вещи. Вы ведь не разрабатывали эту часть, правда?

Большинство команд выпускали память в 2025 и 2026 годах так же, как и уведомления в 2012 году: включали её, наблюдали за гневом пользователей и устраняли самые серьёзные проблемы. Это отличный способ сделать продукт забываемым. Но это ужасный способ заставить пользователей доверять вам свою работу, свои предпочтения и мелкие неловкие факты, которые создают у агента ощущение, что он их знает.

Это руководство для разработчиков по работе с памятью агента. Прочитайте его один раз, а затем исправьте свой продукт.

Что такое память агента на самом деле

Память агента — это всё, что ваш продукт запоминает о пользователе в разных сессиях и использует для изменения своего будущего поведения. Это всё определение. Ключевое слово — «использует для изменения», потому что хранилище без изменения поведения — это просто база данных, а база данных — это не проблема проектирования.

Журнал истории чата — это не память. Память — это список предпочтений, которые модель незаметно внедряет в каждое сообщение. Память — это векторное хранилище прошлых разговоров, которое агент просматривает при необходимости. Закрепленный контекст проекта в Claude или пользовательские инструкции в GPT — это тоже память, просто с другой формой и временем жизни.

Дизайнерам следует учитывать три свойства любой функции памяти: что хранится, когда используется и кто может видеть и изменять это. Если ваш продукт неясен хотя бы по одному из этих трех параметров, ваши пользователи тоже будут неясен, а неясенщие пользователи не доверяют тому, что используют.

Почему память вошла в мейнстрим UX в 2025 и 2026 годах

Три фактора сошлись воедино. ChatGPT предоставил память всем в начале 2025 года, Claude вскоре после этого запустил проекты с постоянным контекстом, а стоимость работы с длительными окнами контекста наконец снизилась настолько, что «просто запоминай все» перестала быть шуткой и стала стратегией продукта. К концу 2025 года память стала стандартным пунктом при запуске продуктов на основе ИИ.

Ожидания пользователей быстро изменились. Люди, которые ежедневно используют Claude, ChatGPT, Cursor и Granola, теперь ожидают, что любой новый инструмент ИИ запомнит их. Их раздражает, когда он запоминает неправильно, и пугает, когда он запоминает то, о чем они даже не подозревали, что сообщили ему.

Предложение продуктов с функциями памяти резко возросло. Предложение продуктов с хорошей архитектурой памяти по-прежнему близко к нулю. Этот пробел — это возможность.

Четыре типа памяти, которые должен знать каждый разработчик

Большинство команд рассматривают память как одну недифференцированную категорию. Это первая ошибка. Существует четыре различных типа, и каждый из них имеет разные требования к хранению, отображению и доверию.

Четыре воксельные карточки с надписями «ПРЕДПОЧТЕНИЯ», «ФАКТЫ О ПОЛЬЗОВАТЕЛЕ», «В РАЗРАБОТКЕ», «СИГНАЛЫ ПОВЕДЕНИЯ», мягкая пастельная палитра, темный студийный фон.

Предпочтения — это заявленные пользователем предпочтения относительно того, как должен вести себя агент. Тон, формат, длина, язык, что пропускать, что всегда включать. Они являются явными, медленно меняющимися и требуют высокого уровня доверия. Пользователи хотят установить эти параметры один раз и забыть о них.

Факты о пользователе — это информация о пользователе как о личности. Имя, должность, компания, проекты, над которыми он работает, используемые инструменты, имена его детей, если он их упомянул. Эта информация быстро накапливается и воспринимается как личная. Пользователи хотят видеть её, редактировать и удалять ненужные данные.

Контекст работы над проектом — это всё, что связано с конкретной задачей. Бриф по бренду со вчерашнего дня, документ, над которым пользователь работает, данные, которые он вставил во вторник. Это ценная информация во время работы и чистый шум после неё. Задача проектирования — понять, когда она перестаёт быть полезной.

Поведенческие сигналы — это предполагаемые шаблоны, которые агент использует для прогнозирования действий. Пользователь всегда хочет код в TypeScript, пользователь всегда отклоняет первые три варианта логотипа, пользователь работает быстрее в 9 вечера, чем в 9 утра. Это наиболее полезная и наиболее незаметная информация, и именно это сочетание делает её наиболее опасной.

Пять принципов доверия при проектировании памяти

Существует пять принципов. Пропустите любой из них, и ваша функция работы с памятью станет уязвимым местом, которое может быть заскриншотировано и опубликовано разгневанным пользователем.

Видимость. Каждый фрагмент памяти, используемый агентом, должен быть доступен одним щелчком мыши из диалога. Не в настройках, не в справочной документации, не спрятан на глубине трех меню. Если пользователю приходится спрашивать: «Откуда он это знает?», вы уже проиграли.

Редактируемость. Каждая запись в памяти должна быть редактируемой как текст и удаляемой одним щелчком мыши. Никаких двусмысленных фраз типа «мы будем использовать это для улучшения нашей модели». Пользователь написал это, пользователь владеет этим, пользователь может удалить это сейчас, и это исчезнет.

Область действия. Память должна иметь объявленную область действия. Для каждого диалога, для каждого проекта, для каждой учетной записи. Предпочтение кратких ответов в вашем редакторе кода не должно проникать в ваш чат-бот для терапии. Область действия — это та часть, в которой большинство продуктов допускают ошибки, и именно эта ошибка быстрее всего разрушает доверие. Срок действия памяти. Память должна иметь срок действия, либо заявленный пользователем, либо определяемый системой. Контекст незавершенной работы должен исчезать после завершения работы. Сигналы поведения должны ослабевать при изменении поведения. Память, существующая вечно, превращается в медленную утечку устаревших данных, отравляющих каждый будущий ответ.

Срок действия памяти. Пользователи должны иметь возможность экспортировать свою память в читаемом формате и использовать её в другом месте. JSON, Markdown, обычный текст — выбирайте любой. Этот принцип доказывает истинность остальных, потому что ничто так не способствует ясности, как необходимость описывать свой слой памяти для чтения другими.

ChatGPT память и проблема скрытых обновлений

ChatGPT память — наиболее часто используемая функция памяти в мире. Она также наиболее наглядно демонстрирует, что происходит, когда вы соблюдаете несколько принципов, но упускаете остальные.

Пять воксельных карточек с надписями VISIBLE, EDITABLE, SCOPED, EXPIRABLE, EXPORTABLE, расположенных на доске, на темном студийном фоне, в мягкой пастельной цветовой гамме.

Видимая часть неплоха. Есть панель памяти, её можно открыть, и можно увидеть записи. Редактируемая часть работает, можно удалить запись, и она исчезнет. Пока всё хорошо.

Проблема в незаметных обновлениях. ChatGPT записывает новые записи в память во время обычного разговора без запроса, и единственный сигнал — это крошечное всплывающее сообщение «Память обновлена», которое исчезает через две секунды. Пользователи регулярно обнаруживают накопленные за месяцы факты, которые они никогда явно не одобряли, включая неправильно истолкованные выводы и неловкие мелочи из разового чата. Поведение по умолчанию вызывает удивление, а удивление — это противоположность доверия.

Решением могло бы стать небольшое запрос на разрешение при первых десяти сохранениях памяти, а также еженедельный дайджест, показывающий, что было добавлено с момента последней проверки пользователем. Ничего из этого нет. Это дизайнерское решение, а не техническое ограничение.

Claude Память в проектах и её преимущества

Подход Claude противоположен подходу ChatGPT. Память в Claude в основном находится внутри проектов, которые представляют собой созданные пользователем контейнеры с чёткими инструкциями и загруженными файлами. Пользователь создаёт проект, даёт ему имя, заполняет его контекстом. Память по своей сути является необязательной.

Это чисто решает проблему области видимости. Ваш проект «Маркетинговая стратегия» не загрязняет ваш проект «Терапевтический дневник», потому что это отдельные контейнеры с отдельным контекстом. Пользователь понимает границу, потому что сам её нарисовал.

Компромисс заключается в том, что Claude делает для вас меньше. Нет автоматического запоминания ваших предпочтений между проектами, поэтому вы в конечном итоге повторяетесь. Новые функции памяти Claude начинают преодолевать этот разрыв, но урок проектирования уже очевиден. Настраиваемые пользователем области действия превосходят области действия, определяемые системой, по уровню доверия, даже если это немного снижает удобство использования.

Правила курсора, шаблон .cursorrules и память как код

Курсор использует совершенно другую модель. Правила проекта хранятся в файле в репозитории, называемом .cursorrules или .cursor/rules/. Разработчики пишут правила в виде обычного текста, фиксируют их в Git, и агент считывает их при каждом взаимодействии.

Это память как код. Она обладает всеми свойствами принципов доверия бесплатно, поскольку текстовые файлы в репозитории по определению видимы, редактируемы, имеют область действия и экспортируемы. Единственным слабым местом является истечение срока действия, которое разработчик должен обрабатывать, редактируя файл.

Урок для продуктов, не предназначенных для разработчиков, заключается не в том, чтобы «поставлять файл конфигурации». Урок в том, что память, которую можно прочитать как единый документ, ощущается безопаснее, чем память, которую нужно запрашивать через пользовательский интерфейс. При проектировании панели памяти сначала разработайте представление документа, а затем редактор поверх него.

Granola, пользовательские инструкции GPT и длинный хвост форм памяти

Granola, инструмент для создания заметок на совещаниях, рассматривает каждый блокнот как отдельный контекст. Агент читает содержимое блокнота, чтобы записывать новые заметки. Нет глобальной памяти о вас как о пользователе. Форма такова: «память — это всё, что находится в комнате», что работает, потому что совещания по своей природе ограничены.

Пользовательские инструкции GPT — это старейшая форма памяти в современной эпохе ИИ. Создатель пишет системную подсказку, пользователь выбирает GPT, подсказка формирует каждый ответ. Она хрупкая, не адаптируется, и всё ещё является наиболее часто используемым механизмом памяти по количеству, потому что она предельно проста и полностью читаема.

Общая закономерность во всех этих случаях заключается в том, что лучшие конструкции памяти делают пользователя автором памяти. Худшие делают систему автором, а пользователя — аудиторией.

Четыре воксельные карточки с надписями THE CREEP, THE SURPRISE, THE LOCK-IN, THE MEMORY HOLE на темном студийном фоне, в мягкой пастельной цветовой гамме.

Четыре основных режима отказов, которые необходимо учитывать при проектировании

Каждая функция работы с памятью дает сбой одним из четырех способов. Назовите их, следите за ними, откажитесь от них на этапе проектирования.

Постепенное накопление. Память накапливается быстрее, чем пользователь может ее обрабатывать. Через три месяца у пользователя накапливается 400 записей, половина из которых неверна или устарела, и нет реального способа их очистить. Исправьте это с помощью ограничений, таймеров затухания и инструментов массового удаления.

Неожиданное использование. Агент использует память, о существовании которой пользователь не знал, и пользователь чувствует, что за ним следят. Исправьте это с помощью проактивного раскрытия информации, вопроса «зачем вы это сказали?» в каждом ответе и явного подтверждения при первом использовании памяти.

Зависимость. Пользователь не может уйти, потому что его память заблокирована в вашем продукте. Исправьте это с помощью экспорта в портативный формат одним щелчком мыши, без маркетинговых писем, ограничивающих доступ, и без необходимости обращения в службу поддержки.

Пробел в памяти. Агент забывает то, что пользователю больше всего нужно запомнить. Пользователь повторяет один и тот же контекст пять раз и переключается между продуктами. Исправьте это с помощью явного закрепления, кнопки «запомнить это», которая делает то, что заявлено, и инспектора памяти, который подтверждает наличие записи.

Выберите, к чему из этого ваш продукт ближе всего прямо сейчас. Это ваш план на следующий квартал.

Словарь проектирования функций памяти

Вы не можете проектировать то, что не можете назвать. Вот рабочий словарь, к которому стремятся лучшие команды, с определениями, которые вы можете позаимствовать.

Карта памяти — это атомарная единица хранимой памяти. Одна карта, один факт или предпочтение, одна метка времени, одна область видимости, один источник. Отображайте карты так же, как и сообщения, с согласованными возможностями для каждой из них.

Чип области видимости — это небольшая таблетка, которая объявляет область памяти или сессии. «Этот разговор», «этот проект», «вся ваша работа», «все». Микросхемы памяти размещаются на картах памяти, в диалогах и в собственных ответах агента, когда он ссылается на память.

Таймер затухания — это видимый обратный отсчет или метка срока действия записи в памяти. «Срок действия истекает через 14 дней», «хранится до закрытия проекта», «постоянно». Таймеры затухания превращают абстрактную идею истечения срока действия в нечто, что пользователь может увидеть и изменить.

Журнал аудита — это запись действий агента и причин, включая то, какие воспоминания он использовал в каждом ответе. Сделайте это доступным одним щелчком мыши для каждого сообщения. Первый продукт, который обеспечит журналы аудита для ответов ИИ, будет доминировать на рынке доверия в течение следующего десятилетия.

Инспектор памяти — это полноэкранное отображение всей сохраненной памяти, организованной по области действия, с возможностью фильтрации по источнику и сортировки по давности. Это самый важный экран в вашем продукте на основе ИИ, и большинство продуктов его не имеют.

Мастер-класс по проектированию функций памяти

Вот шестиэтапный мастер-класс, который вы можете провести за один день, чтобы с нуля разработать функцию памяти. Пригласите дизайнера, менеджера проекта и одного инженера, разбирающегося в уровне модели.

Рабочее пространство воксельного дизайнера с разложенными картами памяти, видимым журналом аудита, микросхемами осциллографа на плате, мягкой пастельной палитрой, темным студийным фоном.

Перечислите четыре типа памяти для вашего продукта. Напишите по одному предложению для каждого типа, описывая, что ваш агент должен помнить в этом сегменте. Если тип не подходит, явно исключите его.
Нарисуйте инспектор памяти. Только инспектор, без других экранов. Как выглядит одна карта памяти, какие фильтры существуют, что пользователь может удалять, редактировать, закреплять или экспортировать.
Определите область действия по умолчанию для каждого типа. Для каждого разговора, для проекта или глобально. Обоснуйте свой выбор одним предложением для каждого типа. Если вы не можете его обосновать, значит, область действия по умолчанию неверна.
Установите политику истечения срока действия для каждого типа. Либо фиксированный срок, либо связанное событие, например, «проект закрывается», либо «постоянно, пока пользователь не удалит». Никакой тип не должен быть неоднозначным.
Разработайте уведомление. Как пользователь узнает, когда память сохраняется, когда она используется и когда обновляется? Будьте конкретны в отношении всплывающих уведомлений, значков, встроенных цитат и еженедельных дайджестов.
Напишите формат экспорта. Откройте текстовый редактор и напишите JSON или Markdown, который будет генерировать ваша кнопка экспорта для пользователя, активно использующего 200 записей в памяти. Если он выглядит как дамп базы данных, переработайте его, пока он не станет выглядеть как заметки.

Это и есть мастер-класс. Запустите его перед первой строкой кода, отвечающего за память, и запустите снова после запуска, когда выясните, что пользователи действительно используют.

Краткое сравнение положения основных продуктов

Вот таблица результатов для продуктов, на которые сегодня ссылается большинство команд. Ваши результаты могут отличаться по мере выпуска обновлений, но структура сильных и слабых сторон остается стабильной.

| |---|---|---|---|---|---|

| ChatGPT память | Частичная | Да | Слабая | Нет | Нет |

| Правила курсора | Да | Да | Сильная | Ручная | Да |

| Пользовательские инструкции GPT | Да | Да | Сильная | Ручная | Да |

Закономерность очевидна. Продукты, позволяющие пользователю создавать контейнер, получают наивысшие оценки по масштабируемости и экспортируемости, но платят за это удобством. Продукты, автоматизирующие работу с памятью, получают наивысшие оценки по удобству, но платят за это доверием. Пока нет продукта, который бы действительно решил обе задачи, поэтому это по-прежнему открытое пространство для проектирования.

Что это значит на следующие два-три года

Три прогноза, все достаточно уверенные, чтобы на них делать ставки.

Инспекторы памяти становятся стандартным элементом интерфейса продукта. В течение 18 месяцев каждый серьезный продукт на основе ИИ будет иметь специальный экран проверки памяти, и качество этого экрана станет одной из трех главных причин, по которым пользователи выбирают один продукт вместо другого. Начните проектировать свой прямо сейчас.

Принципы доверия становятся регулируемыми. Видимость, возможность редактирования и экспорта памяти ИИ появятся в законодательстве о конфиденциальности, вероятно, сначала в ЕС, а затем, вероятно, в более широком масштабе к 2028 году. Продукты, которые рассматривают их как функции, а не как работу по соблюдению требований, займут сегмент с высоким уровнем доверия.

Память становится брендом. Причина, по которой люди остаются с одним продуктом ИИ, а не с другим, перестанет быть связана с качеством модели и начнет зависеть от того, насколько хорошо продукт их запоминает. Модель — это товар, память — это защита. Дизайнеры, которые владеют этой защитой для своих продуктов, будут самыми ценными людьми в командах разработчиков ИИ в этом цикле.

Теперь у вас есть основа. Откройте свой продукт, найдите одну функцию памяти, которая нарушает один из пяти принципов, и исправьте ее на этой неделе.

Память — это не проблема настроек. Это проблема взаимоотношений, замаскированная под хранение данных. Каждая запись в памяти — это небольшое утверждение вашего продукта о том, кто является пользователем, и это утверждение либо соответствует самовосприятию пользователя, либо противоречит ему.

Команды, которые выиграют этот цикл, будут укомплектовывать память так же, как они укомплектовывают поиск или адаптацию новых сотрудников. Выделенный ответственный, еженедельные обзоры того, что было сохранено и почему, реальные метрики точности памяти и доверия пользователей. А не второстепенная задача для бэкенд-разработчика.

Если в вашем плане развития нет работы с памятью на следующий квартал, значит, план неверен. Откройте документ, добавьте работу, назначьте ответственного. Возможность начать работу раньше быстро закрывается.

Need a designer who actually understands AI products? Hire Brainy to design your memory layer.

Get Started

Разработка памяти для агентов: Справочник разработчика 2026 года

Что такое память агента на самом деле

Почему память вошла в мейнстрим UX в 2025 и 2026 годах

Четыре типа памяти, которые должен знать каждый разработчик

Пять принципов доверия при проектировании памяти

ChatGPT память и проблема скрытых обновлений

Claude Память в проектах и её преимущества

Правила курсора, шаблон .cursorrules и память как код

Granola, пользовательские инструкции GPT и длинный хвост форм памяти

Четыре основных режима отказов, которые необходимо учитывать при проектировании

Словарь проектирования функций памяти

Мастер-класс по проектированию функций памяти

Краткое сравнение положения основных продуктов

Что это значит на следующие два-три года

Related Papers

Context Window Explained: Why Long AI Chats Get Worse

Claude Code for Designers: A Working Designer's Setup

Prompt Engineering for Designers: From Vague Briefs to Usable AI Output

Keep reading

Context Window Explained: Why Long AI Chats Get Worse

Claude Code for Designers: A Working Designer's Setup

Prompt Engineering for Designers: From Vague Briefs to Usable AI Output

Что такое память агента на самом деле

Почему память вошла в мейнстрим UX в 2025 и 2026 годах

Четыре типа памяти, которые должен знать каждый разработчик

Пять принципов доверия при проектировании памяти

ChatGPT память и проблема скрытых обновлений

Claude Память в проектах и ​​её преимущества

Правила курсора, шаблон .cursorrules и память как код

Granola, пользовательские инструкции GPT и длинный хвост форм памяти

Четыре основных режима отказов, которые необходимо учитывать при проектировании

Словарь проектирования функций памяти

Мастер-класс по проектированию функций памяти

Краткое сравнение положения основных продуктов

Что это значит на следующие два-три года

Related Papers

Context Window Explained: Why Long AI Chats Get Worse

Claude Code for Designers: A Working Designer's Setup

Prompt Engineering for Designers: From Vague Briefs to Usable AI Output

Keep reading

Context Window Explained: Why Long AI Chats Get Worse

Claude Code for Designers: A Working Designer's Setup

Prompt Engineering for Designers: From Vague Briefs to Usable AI Output

Claude Память в проектах и её преимущества