ai for designersApril 28, 202614 min read

Шаблоны проектирования пользовательского интерфейса для ИИ-агентов: как создавать интерфейсы для автономных инструментов.

Рабочая библиотека шаблонов для проектирования пользовательского интерфейса агентов ИИ. Восемь реальных примеров разбора продуктов: Claude Code, Cursor, Devin, Linear, ChatGPT Operator, Replit Agent, Bolt и v0, а также семь шаблонов, необходимых для любого интерфейса агента.

By Boone

X LinkedIn

Дизайн пользовательского интерфейса для ИИ-агента — это не дизайн чата с добавленной автономностью. Агент — это автономный работник, который берет цель, планирует путь и запускает инструменты, не запрашивая разрешения на каждом шаге. Интерфейс для этого работника — это панель управления, а не диалог. Продукты, предлагающие самые чистые пользовательские интерфейсы для агентов, рассматривают их именно так с самого первого макета.

В каждом достойном использовании пользовательском интерфейсе агента присутствуют семь шаблонов: формулировка задач, управление автономностью, панель планирования, поток прогресса, контрольные точки подтверждения, восстановление после ошибок и передача управления агенту. Большинство современных продуктов предлагают четыре из этих семи шаблонов, делая вид, что остальные три не имеют значения. В результате получается интерфейс, который хорошо работает в демонстрационных версиях, но разваливается в реальных условиях.

Этот фрагмент — решение проблемы, определяющее операционную эффективность. Семь шаблонов, восемь разборов Claude Code, Cursor, Devin, Linear AI, ChatGPT Operator, Replit Agent, Bolt и v0, три распространённые ошибки и точное решение, а также пятнадцатиминутный контрольный список для подготовки к выпуску, который может выполнить любой дизайнер, прежде чем пользовательский интерфейс попадёт в руки реального пользователя.

Пользовательские интерфейсы агентов — это поверхности управления, а не окна чата

Пользовательский интерфейс агента ИИ — это интерфейс для автономного работника. Задача проектирования ближе к кабине пилота, чем к чату. Пользователь больше не переписывается, он ставит цель и контролирует процесс.

Пользовательский интерфейс чата оптимизирован для поочередного выполнения задач. Пользовательский интерфейс агента оптимизирован для ясности цели, видимости плана, телеметрии прогресса и возможностей переопределения. Большинство ранних продуктов для агентов допустили ошибку, расширив чат несколькими индикаторами «размышления» и журналом использования инструментов. Пользователь сидел, уставившись в чат, без возможности увидеть план, без возможности приостановить выполнение и без возможности восстановиться, когда агент вышел из-под контроля. Рассматривайте пользовательский интерфейс агента как панель управления, и семь описанных ниже шаблонов перестанут быть необязательными и станут определяющими.

Семь шаблонов, необходимых для каждого пользовательского интерфейса агента

Формулировка задачи, ползунок автономности, поверхность плана, поток прогресса, контроль подтверждения, восстановление после ошибок и передача управления агенту. Каждый современный пользовательский интерфейс агента представляет собой комбинацию этих семи шаблонов.

Формулировка задачи — это способ, которым пользователь формулирует цель. Контроль автономности — это способ, которым пользователь определяет, насколько свободен агент. Поверхность плана — это место, где агент определяет последовательность шагов, прежде чем приступить к действию. Поток прогресса — это прямая трансляция того, что агент делает прямо сейчас. Контроль подтверждения — это момент задержки перед деструктивным действием. Восстановление после ошибок — это путь назад после неудачного шага. Передача управления агенту — это передача состояния, которая перемещает задачу от агента к человеку или от агента к агенту без потери контекста.

Воксельная диаграмма из семи небольших тяжелых блоков, расположенных в горизонтальном ряду на полу студии, каждый блок имеет свой приглушенный цвет, с однословными надписями: FRAME AUTONOMY PLAN PROGRESS CONFIRM RECOVER HANDOFF

Эти семь пунктов не равны по значимости, но все они необходимы. Продукт, который поставляется с описанием задачи без плана выполнения, — это игра в угадайку. Продукт, который поставляется со всем, кроме подтверждающих этапов, — это катастрофа, которая вот-вот произойдет. Эти закономерности накапливаются. Пропуск одного ослабляет остальные.

Описание задачи задает контракт

Плохое описание задачи — это стандартное окно чата, где пользователь вводит расплывчатое предложение, а агент заполняет остальное предположениями. Хорошее описание задачи — это структурированный ввод, который запрашивает конкретную информацию, необходимую агенту.

Функции ИИ Linear отлично справляются с этим. Пользователь вводит краткое описание задачи, а ИИ преобразует его в структурированную задачу с заголовком, описанием, метками и назначением проекта, которое пользователь может редактировать перед подтверждением. Описание задачи ограничено, вывод структурирован, и есть четкая возможность редактирования перед подтверждением.

План выполнения задачи должен быть таким же структурированным, как и сама задача. Для задачи программирования необходимы цель, целевой файл и критерий приемки. Для задачи веб-автоматизации необходимы начальный URL-адрес, целевое действие и условие остановки. Стандартный ввод в чат подходит для исследования, но не подходит для использования в производственной среде.

Управление автономией позволяет пользователю выбирать режим работы

Доверие — это не постоянная величина, и одна настройка не охватит все задачи.

Claude Code делает это с помощью своей системы разрешений. Пользователь может работать в режиме, где каждый вызов инструмента требует подтверждения, распространенные инструменты автоматически подтверждают запрос, а рискованные по-прежнему блокируют доступ, или в режиме полной автономии. Режим виден, переключается в середине сессии, и пользователь точно знает, в каком режиме работает агент.

В большинстве продуктов встроена только одна настройка автономности, нет управления для каждой задачи, нет видимого статуса. Пользователь не знает, спросит ли агент разрешения перед развертыванием, перед удалением, перед отправкой электронного письма. Эта неопределенность приучает пользователей либо к чрезмерному контролю, либо к слепому доверию. Оба варианта — это провал.

План действий — это первое обещание агента

Прежде чем агент начнет действовать, он должен показать, что он намерен сделать. План должен быть читаемым, редактируемым и отклоняемым.

Девин выпустил одну из первых работающих поверхностей планирования. Агент генерирует план, пользователь редактирует любой шаг прямо в нем, удаляет шаги, добавляет шаги или отклоняет весь план. После утверждения план становится журналом выполнения, при этом каждый шаг подсвечивается по мере работы агента над ним. Поверхность плана и поток прогресса представляют собой одну и ту же поверхность в двух состояниях: до выполнения и во время выполнения, что является правильным архитектурным решением.

Воксельная композиция из двух расположенных рядом поверхностей на полу студии: слева — вертикальная стопка ступенчатых плиток с изображением флажка, справа — высокая колонна с горизонтальными полосами прогресса, опускающимися подобно живому бревну.

Распространенная ошибка. В продуктах план отображается в виде абзаца текста вместо структурированного списка. План фактически не редактируется, что означает, что пользователь либо утверждает его вслепую, либо запрашивает повторное утверждение. Исправление заключается в машинной структуризации: список отдельных шагов, каждый шаг — строка, каждая строка редактируема.

Поток прогресса — это цикл доверия

Агент работает, а пользователь ждет, поэтому поток прогресса — единственное, что отделяет пользователя от решения прервать выполнение.

В интерфейсе агента Cursor это реализовано правильно. Пока агент редактирует файлы, разница отображается в редакторе в режиме реального времени. По мере выполнения команд вывод терминала также передается в реальном времени. Пользователь может в любой момент прекратить наблюдение и вернуться к полному логу. Доверие недолговечно, потому что поток честен.

Сравните это с агентом, который передает сводку в стиле чата, например, «Сейчас я рассматриваю следующий шаг», при этом незаметно выполняя десять вызовов инструментов в фоновом режиме. Сводка — это дымовая завеса. Передавайте каждый вызов инструмента и редактирование файла в структурированный лог и сжимайте рассуждения модели в однострочное резюме для каждого шага. Смешивание этих двух вещей подрывает доверие.

Подтверждающие шлюзы защищают от деструктивных действий

Некоторые действия нельзя отменить, и пользовательский интерфейс должен намеренно замедлять эти моменты.

ChatGPT Оператор обрабатывает это в открытом веб-пространстве. Когда агент собирается отправить форму, заполнить платежную информацию или выполнить действие, связанное с учетной записью, он делает паузу и запрашивает у пользователя подтверждение, изменение или отмену. Пауза видна, действие описывается в виде простого текста, и пользователь может вручную возобновить сеанс браузера.

Воксельная композиция, изображающая массивные коралловые арочные ворота на полу студии с двумя воксельными кнопками у их основания, зеленым кубом «ПОДТВЕРДИТЬ» и меньшим янтарным кубом «ОТМЕНИТЬ», а также небольшой глиф агента, застывший на противоположной стороне ворот.

Ошибка большинства продуктов заключается в том, что они обрабатывают каждое действие с одинаковым весом подтверждения. Либо все действия проходят проверку, приучая пользователей переходить по ссылкам, не читая текст, либо ничего не проверяется, позволяя агенту наносить необратимый ущерб. Необходимо разделить действия на три уровня сложности. Мягкая проверка для обратимых операций записи (тридцатисекундный баннер отмены). Жесткая проверка для деструктивных действий (модальное окно подтверждения). Двухэтапная проверка для катастрофических действий (модальное окно плюс набранная фраза подтверждения).

Восстановление после ошибок — это половина успеха продукта

Агенты постоянно дают сбои, и надежными кажутся те продукты, у которых самые чистые поверхности восстановления, а не те, у которых самые высокие показатели успешности.

Bolt и v0 отлично справляются с этим. Когда сборка завершается с ошибкой, сообщение об ошибке отображается непосредственно в коде, агент пытается исправить ошибку, и пользователь может позволить ему продолжить работу или сразу же внести правки в код. Состояние сохраняется между попытками.

Большинство продуктов терпят здесь неудачу. Происходит ошибка, агент останавливается, пользователь получает сообщение «Что-то пошло не так, попробуйте еще раз», не имея представления о состоянии системы. Каждая ошибка должна иметь четкий статус, набор вариантов восстановления (повторная попытка, редактирование, перехват, отказ) и гарантию сохранения состояния. Ошибки — это типичный опыт работы агента в реальных условиях, а не редкое событие.

Передача задач от агента к человеку требует документального подтверждения

Когда задача переходит от агента к человеку или от агента к агенту, принимающей стороне необходимо полное состояние без необходимости запрашивать его.

Функции ИИ Linear решают эту проблему, записывая структурированные обновления обратно в задачу. Следующий участник команды получает полный контекст непосредственно в коде. Никакой отдельной панели управления, никакого дополнительного инструмента. Каждый переданный процесс должен создавать артефакт дампа состояния (структурированный комментарий, сгенерированный бриф, сохраненная контрольная точка), который получатель сможет прочитать менее чем за тридцать секунд. Если получателю приходится спрашивать: «На чем вы остановились?», значит, передача не удалась. Та же дисциплина, которую хороший оперативное проектирование для дизайнеров требует от любого многократно используемого рабочего процесса.

Восемь реальных интерфейсов агентов с аннотациями

Шаблоны имеют значение только в том случае, если они выдерживают проверку в выпущенных продуктах. Сейчас в производстве восемь, каждый короткий, ни один не идеален.

Claude Code, интерфейс агента как прозрачный терминал

Claude Code — это самый чистый интерфейс агента, выпущенный на сегодняшний день, потому что он рассматривает терминал как поверхность и отказывается скрывать то, что делает агент. Каждый вызов инструмента передается на терминал, каждое редактирование файла показывает разницу, каждая команда показывает свой вывод. Победа — в честности. Недостаток: поверхность плана — это Markdown, а не редактируемый структурированный список.

Cursor, интерфейс агента как среда для парного программирования

Агент в Cursor кажется невидимым, пока он вам не понадобится, что является высшей формой мастерства в разработке пользовательского интерфейса агента. Небольшие изменения происходят сами собой и отображают разницу. Многофайловые рефакторинги отображают план. Преимущество заключается в калибровке присутствия: Cursor масштабирует видимость агента в соответствии с задачей. Недостаток: поверхность плана для сложных рефакторингов больше похожа на чат, чем на редактируемый список задач.

Devin, интерфейс агента как театральное рабочее пространство

Devin отображает полное рабочее пространство агента, включая браузер в реальном времени, терминал и редактор, и ставка на то, что прозрачность быстрее укрепляет доверие, чем абстракция. Структурированный редактируемый план виден с самого начала. Все рабочее пространство представляет собой поток прогресса. Пользователь берет управление на себя на любом уровне. Преимущество заключается в полной видимости. Недостаток: рабочее пространство слишком громоздкое для простых задач.

Linear ИИ, интерфейс агента как встроенный помощник

Функции ИИ в Linear интегрированы в существующую структуру Linear, что является правильным подходом для встроенных агентов, которые должны ощущаться как члены команды, а не как отдельное приложение. ИИ возвращает структурированный артефакт (проблему, комментарий, обновление статуса), который находится внутри существующего потока. Преимущество заключается во встраивании. Недостаток: многоэтапные автономные задачи требуют плановой поверхности и потока прогресса, которые Linear еще не реализованы.

ChatGPT Оператор, интерфейс агента как контролируемый браузер

Оператор работает в изолированном браузере, за которым пользователь может наблюдать, приостанавливать и брать управление на себя, что является правильным подходом для агентов, работающих в открытом интернете. Браузер в реальном времени — это поток прогресса. Платежи и действия, связанные с учетной записью, являются контролирующими. Преимущество заключается в самом шаблоне контролируемого браузера, где скорость обменивается на доверие. В чём заключается недостаток: план работы находится в чате, оторванный от потока прогресса, что затрудняет корректировку курса в процессе выполнения.

Replit Agent, Bolt и v0: интерфейс агента как холст для сборки

Replit Agent, Bolt и v0 используют один и тот же шаблон: подсказка слева, предварительный просмотр справа, а работа агента происходит между ними. Пользователь описывает, что нужно собрать, агент работает до тех пор, пока не отобразит предварительный просмотр. Преимущество заключается в холсте для сборки, который делает абстрактную задачу «собери мне приложение» конкретной. В чём недостаток: Replit Agent скрывает слишком много состояния внутри потока агента. В Bolt поверхность планирования для сложных приложений слишком узкая. Цикл итерации v0 при редактировании нескольких компонентов ближе к чату, чем к структурированному плану. Lovable, в том же ключе, предлагает более надежную поверхность планирования, но более слабый поток прогресса.

Хотите интерфейс агента, который завоевывает доверие с первого запуска, а не с десятого? Нанимайте Brainy. AppBrainy поставляет интерфейсы для агентов, предназначенные для команд, разрабатывающих автономные инструменты, а ClaudeBrainy — Claude Навыки и библиотеки подсказок, которые обеспечивают корректную работу агента еще до того, как интерфейсу придется его корректировать.

Три распространенные ошибки в интерфейсе агента и их исправление

В большинстве интерфейсов агентов встречаются одни и те же три ошибки, и их исправление не является простым.

Первая. Агент, скрывающий план. Продукт принимает цель, работает в фоновом режиме и сообщает о результате. У пользователя нет плана для просмотра, нет прогресса для отслеживания, нет возможности остановить выполнение. Исправление: отобразить структурированный редактируемый план перед выполнением, даже если он состоит всего из двух строк. Цена — двадцать пикселей интерфейса. Преимущество в том, что пользователь может исправить агента до того, как он выпустит неправильный результат.

Вторая. Агент, подтверждающий все действия. Продукт блокирует каждое действие модальным окном, приучая пользователя переходить по ссылкам, не читая. К моменту выполнения деструктивного действия пользователь переходит и по этой ссылке. Исправление: разделите действия на обратимые, деструктивные и катастрофические. Заблокируйте только последние два типа, а обратимые действия разрешайте выполнять с тридцатисекундным баннером отмены.

Третье. Агент, скрывающий сбой. Продукт молча повторяет попытки, игнорирует ошибки или сообщает «что-то пошло не так», не объясняя, что именно. Исправление: отображайте каждую ошибку с указанием точки отказа, состояния системы и конкретных вариантов восстановления. Доверие возникает из честного сбоя, а не из скрытого.

Каждое исправление — это не перепроектирование. Это добавление или удаление одной поверхности, пока шаблоны не смогут выполнять свою работу. Большинство ошибок в пользовательском интерфейсе агента — это проблемы шаблонов, замаскированные под проблемы проектирования.

Пятнадцатиминутный контрольный список перед выпуском

Запустите это на любом пользовательском интерфейсе агента, прежде чем он попадет к реальному пользователю, и вы обнаружите шаблоны, которые дают сбой в производственной среде.

Формулировка задачи. Укажите типичную цель. Обеспечивает ли ввод достаточную структуру для того, чтобы агент мог действовать в соответствии с ней?
Видимость автономии. Можно ли за секунду определить, что сделает агент, не спрашивая?
Планирование. Выполните нетривиальную задачу. Отображает ли агент структурированный редактируемый план перед началом действия?
Честность прогресса. Видны ли вызовы инструментов и редактирование файлов, или поток представляет собой сводку в стиле чата?
Возможность приостановки. Попробуйте приостановить работу агента. Видна ли кнопка паузы и активна ли она немедленно?
Сортировка подтверждений. Выполняются ли обратимые действия свободно, деструктивные действия блокируются модальным окном, а катастрофические действия требуют ввода подтверждения?
Видимость ошибок. Принудительное завершение работы. Отображает ли пользовательский интерфейс ошибку с указанием состояния и вариантов восстановления?
Возможность отмены. Есть ли четкий путь отмены в течение тридцати секунд после выполнения обратимого действия?
Сохранение состояния. Если шаг завершился неудачей, повторите его. Сохраняется ли предыдущая работа?
Артефакт передачи. Остановите задачу в середине выполнения. Есть ли дамп состояния, с которого следующий пользователь мог бы продолжить? 11. Журнал использования инструментов. Является ли журнал структурированным и машиночитаемым, или он смешивает рассуждения и действия?
Аварийный выключатель. Всегда ли он виден, или скрыт в меню настроек?

Продукт, прошедший эти двенадцать проверок, имеет функциональный пользовательский интерфейс агента. Пользователь будет знать, что делает агент и как его остановить.

Часто задаваемые вопросы

Что такое проектирование пользовательского интерфейса для ИИ-агента?

Проектирование пользовательского интерфейса для ИИ-агента — это дисциплина создания интерфейсов для автономных ИИ-работников, которые принимают цель, планируют шаги и запускают инструменты без предварительного согласования каждого шага. В отличие от интерфейсов чатов, пользовательские интерфейсы агентов представляют собой поверхности управления с семью основными шаблонами: формулирование задач, управление автономностью, поверхности планирования, потоки прогресса, контрольные точки подтверждения, восстановление после ошибок и передача управления агенту.

Чем отличается пользовательский интерфейс ИИ-агента от пользовательского интерфейса чат-бота?

Пользовательский интерфейс чат-бота предполагает пошаговый диалог. Интерфейс агента предполагает, что агент работает в фоновом режиме, выполняет множество вызовов инструментов, изменяет состояние и сообщает о необходимости ввода данных человеком. Интерфейсы агентов должны иметь поверхности плана, потоки реального прогресса, контрольные точки подтверждения и кнопки аварийного завершения, чего нет в интерфейсах чата.

Какие ключевые шаблоны используются при проектировании интерфейсов ИИ-агентов?

Семь шаблонов: формулировка задачи, управление автономностью, поверхность плана, поток прогресса, контрольные точки подтверждения, восстановление после ошибок и передача управления агенту. Размер интерфейса соответствует задаче, калибровка по уровню доверия и тесная поддержка контекстная эффективность на уровне модели.

Какие продукты для ИИ-агентов имеют лучший дизайн интерфейса?

Claude Code выигрывает по прозрачности. Cursor выигрывает по калибровке присутствия. Devin выигрывает по видимости рабочего пространства. Linear AI выигрывает по встраиванию. ChatGPT Operator выигрывает по контролируемому выполнению. Replit Agent, Bolt и v0 выигрывают по шаблону построения холста. Ни один из них не поддерживает все семь шаблонов в полной мере, поэтому эта категория по-прежнему остается открытой.

Как сбалансировать автономность и контроль в пользовательском интерфейсе агента?

Сделайте автономность видимой, настраиваемой настройкой для каждой сессии, каждой задачи, каждого инструмента. Разделите действия на обратимые (свободное выполнение с отменой), деструктивные (контроль с помощью модального окна) и катастрофические (контроль с помощью подтверждения ввода). Отображайте план до выполнения и ход выполнения во время него. Позвольте пользователю приостановить, перехватить или остановить выполнение в любой момент. Доверие масштабируется за счет возможности переопределения, а не за счет скрытой сложности.

Изменения, которые на самом деле открывают пользовательские интерфейсы агентов

Пользовательский интерфейс агента — это не продукт чата с добавленной автономностью, это новая модель взаимодействия, и продукты, которые рассматривают ее именно так, выигрывают.

Большинство команд рассматривают пользовательский интерфейс агента как функцию поверх чата. Они берут чат, добавляют индикатор «размышления», вставляют несколько всплывающих окон использования инструментов и называют это агентом. В результате получается чат-бот с повышенной задержкой. Каждая ошибка в чате усугубляется, потому что агент теперь работает дольше и наносит больше вреда при сбое.

Изменение заключается в том, чтобы рассматривать агента как автономного работника, а пользовательский интерфейс — как панель управления работника. Чат становится одним элементом внутри большей панели с доской планирования, потоком прогресса, переключателем автономности, модальным окном подтверждения, консолью ошибок и артефактом передачи. Пользователь больше не является собеседником агента, пользователь — его руководителем.

Если ваша команда выпускает агента, которого пользователи либо одержимо нянчат, либо слепо доверяют ему, проблема почти всегда заключается в шаблонности. Решение — семь описанных выше шаблонов, адаптированных под задачу, откалиброванных для обеспечения доверия, встроенных в реальную систему Рабочий процесс проектирования с использованием ИИ, а не прикрученных к ней.

Если вам нужен интерфейс агента, который завоевывает доверие с первого запуска, а не с десятого, нанять Brainy. AppBrainy предоставляет полноценный интерфейс продукта для агентов, предназначенный для команд, разрабатывающих автономные инструменты. ClaudeBrainy предоставляет Claude Code рабочие процессы, пакеты навыков и библиотеки подсказок, которые правильно настраивают уровень агента, так что интерфейсу не приходится ничего компенсировать.

Want an agent UI that earns trust on the first run, not the tenth? Brainy ships ClaudeBrainy as a Skill pack and prompt library, and AppBrainy ships full agent product UI for teams building autonomous tools they want their users to actually use.

Get Started