ai for designersApril 28, 202614 min read

Padrões de Design de Interface do Usuário para Agentes de IA: Como Criar Interfaces para Ferramentas Autônomas

Uma biblioteca de padrões funcionais para design de interfaces de usuário de agentes de IA. Oito análises detalhadas de produtos reais: Claude Code, Cursor, Devin, Linear, ChatGPT Operator, Replit Agent, Bolt e v0, além dos sete padrões essenciais para qualquer interface de agente.

By Boone
XLinkedIn
ai agent ui design patterns

O design da interface do agente de IA não é um design de chat com autonomia adicionada posteriormente. Um agente é um trabalhador autônomo que recebe um objetivo, planeja um caminho e executa ferramentas sem pedir permissão para cada etapa. A interface para esse trabalhador é uma superfície de controle, não uma conversa. Os produtos que oferecem as interfaces de agente mais limpas tratam isso desde o primeiro wireframe.

Sete padrões aparecem em toda interface de agente que vale a pena usar: enquadramento de tarefas, controles de autonomia, superfície de planejamento, fluxo de progresso, portões de confirmação, recuperação de erros e transferência de agentes. A maioria dos produtos hoje oferece quatro desses sete padrões e ignora os outros três. O resultado é uma interface que funciona bem em demonstrações, mas falha no uso real.

Este texto é a solução operacional. Os sete padrões, oito análises detalhadas de Claude Code, Cursor, Devin, Linear AI, ChatGPT Operator, Replit Agent, Bolt e v0, três bugs comuns e suas respectivas soluções, além de um checklist de quinze minutos que qualquer designer pode executar antes que a interface do usuário seja utilizada por um usuário real.

Interfaces de agentes são superfícies de controle, não janelas de chat

Uma interface de agente de IA é a interface para um trabalhador autônomo. O desafio de design se assemelha mais a um cockpit do que a uma conversa de chat. O usuário não está mais digitando para frente e para trás, mas sim definindo uma meta e supervisionando um processo.

Uma interface de chat otimiza a alternância de turnos. Uma interface de agente otimiza a clareza da meta, a visibilidade do plano, a telemetria do progresso e as possibilidades de sobreposição. A maioria dos primeiros produtos de agentes errou nesse ponto, estendendo o chat com alguns indicadores de "pensamento" e um registro de uso de ferramentas. O usuário estava sentado, olhando fixamente para uma conversa, sem conseguir visualizar o plano, pausar a execução ou se recuperar quando o agente se comportava de forma inadequada. Trate a interface do agente como uma superfície de controle e os sete padrões abaixo deixarão de ser opcionais e se tornarão essenciais.

Os sete padrões que toda interface de agente precisa

Estruturação da tarefa, controle de autonomia, superfície de planejamento, fluxo de progresso, portão de confirmação, recuperação de erros e transferência de agente. Toda interface de agente disponível atualmente é uma combinação desses sete elementos.

A estruturação da tarefa é como o usuário define o objetivo. Os controles de autonomia permitem que o usuário escolha o nível de liberdade que o agente terá. A superfície de planejamento é onde o agente se compromete com uma sequência de etapas antes de agir. O fluxo de progresso é a transmissão ao vivo do que o agente está fazendo no momento. O portão de confirmação é o momento de pausa antes de uma ação destrutiva. A recuperação de erros é o caminho de volta após uma etapa com falha. A transferência de agente é o despejo de estado que move uma tarefa do agente para um humano ou de um agente para outro, sem perda de contexto.

Diagrama voxel de sete pequenos blocos pesados ​​dispostos em uma fileira horizontal no chão do estúdio, cada bloco de uma cor neutra diferente, com etiquetas de uma única palavra: FRAME AUTONOMY PLAN PROGRESS CONFIRM RECOVER HANDOFF
Diagrama voxel de sete pequenos blocos pesados ​​dispostos em uma fileira horizontal no chão do estúdio, cada bloco de uma cor neutra diferente, com etiquetas de uma única palavra: FRAME AUTONOMY PLAN PROGRESS CONFIRM RECOVER HANDOFF

Os sete elementos não têm o mesmo peso, mas todos são necessários. Um produto que oferece enquadramento de tarefas sem um plano de planejamento é um jogo de adivinhação. Um produto que oferece tudo, exceto os mecanismos de confirmação, é um desastre anunciado. Os padrões se acumulam. Ignorar um enfraquece os outros.

O enquadramento da tarefa define o contrato

Um enquadramento de tarefa ruim é como uma caixa de bate-papo genérica onde o usuário digita uma frase vaga e o agente preenche o resto com suposições. Um bom enquadramento de tarefa é uma entrada estruturada que solicita as informações específicas que o agente precisa saber.

Os recursos de IA do Linear fazem isso muito bem. O usuário digita um breve resumo e a IA o analisa, transformando-o em uma tarefa estruturada com título, descrição, rótulos e uma atribuição de projeto que o usuário pode editar antes de confirmar. O enquadramento é restrito, a saída é estruturada e há uma clara possibilidade de edição antes da confirmação.

O plano de enquadramento deve ser tão estruturado quanto a própria tarefa. Uma tarefa de programação precisa de um objetivo, um arquivo de destino e um critério de aceitação. Uma tarefa de automação web precisa de uma URL inicial, uma ação de destino e uma condição de parada. A entrada genérica de chat é adequada para exploração, mas inadequada para produção.

Os controles de autonomia permitem que o usuário escolha o rumo

A confiança não é constante e uma única configuração não abrange todas as tarefas.

⟦MARCA1⟧ resolve isso com seu sistema de permissões. O usuário pode executar o programa em um modo no qual cada chamada de ferramenta requer aprovação, as ferramentas comuns aprovam automaticamente e as ferramentas de risco ainda exigem aprovação prévia, ou em autonomia total. O modo é visível, pode ser alternado durante a sessão e o usuário sabe exatamente qual controle está sendo exercido sobre o agente.

A maioria dos produtos oferece apenas uma configuração de autonomia integrada, sem controle por tarefa e sem status visível. O usuário não tem ideia se o agente pedirá permissão antes de implantar, antes de excluir ou antes de enviar um e-mail. Essa incerteza leva os usuários a monitorarem tudo obsessivamente ou a confiarem cegamente. Ambos são modos de falha.

A superfície de planejamento é a primeira promessa do agente

Antes de agir, o agente precisa mostrar o que pretende fazer. O plano precisa ser legível, editável e passível de rejeição.

Devin lançou uma das primeiras superfícies de planejamento que funcionou. O agente gera um plano, o usuário edita qualquer etapa diretamente no plano, exclui etapas, adiciona etapas ou rejeita o plano inteiro. Uma vez aprovado, o plano se torna o registro de execução, com cada etapa sendo destacada conforme o agente trabalha nela. A superfície de planejamento e o fluxo de progresso são a mesma superfície em dois estados: antes da execução e durante a execução, o que representa a escolha arquitetônica correta.

Composição voxel de duas superfícies empilhadas lado a lado no chão do estúdio: à esquerda, uma pilha vertical de ladrilhos com degraus e um ícone de caixa de seleção; à direita, uma coluna alta com barras de progresso horizontais que descem como um registro em tempo real.
Composição voxel de duas superfícies empilhadas lado a lado no chão do estúdio: à esquerda, uma pilha vertical de ladrilhos com degraus e um ícone de caixa de seleção; à direita, uma coluna alta com barras de progresso horizontais que descem como um registro em tempo real.

Um bug comum. Produtos que exibem um plano como um parágrafo de texto em vez de uma lista estruturada. O plano não é realmente editável, o que significa que o usuário aprova cegamente ou solicita a confirmação novamente. A solução é a estruturação automática: uma lista de etapas discretas, cada etapa em uma linha, e cada linha editável.

O fluxo de progresso é o ciclo de confiança

O agente está trabalhando e o usuário está aguardando, portanto, o fluxo de progresso é a única coisa que separa o usuário da decisão de encerrar a execução.

A interface do agente do Cursor acerta nesse ponto. Conforme o agente edita arquivos, as diferenças aparecem ao vivo no editor. Conforme ele executa comandos, a saída do terminal é exibida em tempo real. O usuário pode interromper a visualização a qualquer momento e retornar a um registro completo. A confiança é construída rapidamente porque o fluxo é honesto.

Compare isso com um agente que exibe um resumo no estilo de um chat, como "Estou considerando o próximo passo", enquanto executa silenciosamente dez chamadas de ferramentas em segundo plano. O resumo é uma cortina de fumaça. Exiba cada chamada de ferramenta e edição de arquivo em um registro estruturado e comprima o raciocínio do modelo em um resumo de uma linha por etapa. Confundir os dois destrói a confiança.

Portões de confirmação protegem as ações destrutivas

Algumas ações não podem ser desfeitas, e a interface do usuário precisa tornar esses momentos propositalmente lentos.

⟦MARCA14⟧ O operador lida com isso na web aberta. Quando o agente está prestes a enviar um formulário, preencher informações de pagamento ou realizar uma ação que afeta a conta, ele pausa e pede ao usuário para aprovar, modificar ou cancelar. A pausa é visível, a ação é descrita em texto simples e o usuário pode assumir o controle da sessão do navegador manualmente.

Composição voxel de um pesado portal em arco de coral no chão do estúdio com dois botões voxel na base, um cubo verde CONFIRMAR e um cubo âmbar menor CANCELAR, com um pequeno glifo de agente pausado do outro lado do portal.
Composição voxel de um pesado portal em arco de coral no chão do estúdio com dois botões voxel na base, um cubo verde CONFIRMAR e um cubo âmbar menor CANCELAR, com um pequeno glifo de agente pausado do outro lado do portal.

O erro que a maioria dos produtos comete é tratar todas as ações com o mesmo peso de confirmação. Ou tudo é bloqueado, treinando os usuários a clicarem sem ler, ou nada é bloqueado, permitindo que o agente cause danos irreversíveis. Classifique as ações em três intensidades. Bloqueio suave para gravações reversíveis (um banner de desfazer de trinta segundos). Bloqueio rígido para ações destrutivas (um modal de confirmação). Bloqueio em duas etapas para ações catastróficas (um modal mais uma frase de confirmação digitada).

A recuperação de erros é metade do produto

Os agentes falham constantemente, e os produtos que parecem confiáveis ​​são aqueles com as superfícies de recuperação mais limpas, não aqueles com as maiores taxas de sucesso. O Bolt e a versão 0 fazem isso bem. Quando uma compilação falha, o erro aparece em linha, o agente tenta corrigi-lo e o usuário pode permitir que ele itere ou intervir e editar o código diretamente. O estado é preservado entre as tentativas.

A maioria dos produtos falha aqui. Ocorre um erro, o agente para, o usuário recebe a mensagem "algo deu errado, quero tentar novamente" sem ter ideia de em que estado o sistema se encontra. Cada erro precisa de um status claro, um conjunto de opções de recuperação (tentar novamente, editar, assumir o controle, abandonar) e uma garantia de preservação de estado. Erros são a experiência típica de um agente em uso real, não um evento raro.

A transferência de tarefas entre agentes precisa de um registro

Quando uma tarefa passa de um agente para um humano, ou de um agente para outro, a parte que a recebe precisa do estado completo sem precisar solicitar.

Os recursos de IA do Linear lidam com isso gravando atualizações estruturadas de volta na tarefa. O próximo membro da equipe tem o contexto completo em linha. Sem painel separado, sem ferramenta extra. Cada transferência de informações deve gerar um artefato de estado (um comentário estruturado, um resumo gerado, um ponto de verificação salvo) que o receptor possa ler em menos de trinta segundos. Se o receptor precisar perguntar "onde você parou?", a transferência falhou. A mesma disciplina que uma boa Engenharia ágil para designers exige de qualquer fluxo de trabalho reutilizável.

Oito interfaces de usuário reais para agentes, com anotações

Os padrões só importam se sobreviverem ao contato com os produtos lançados. Oito estão em produção atualmente, cada uma curta, nenhuma perfeita.

⟦MARCA2⟧, interface de usuário do agente como terminal transparente

⟦MARCA3⟧ é a interface de usuário para agentes mais limpa lançada até o momento, porque trata o terminal como a superfície e se recusa a ocultar o que o agente está fazendo. Cada chamada de ferramenta é exibida no terminal, cada edição de arquivo mostra um diff, cada comando mostra sua saída. A vantagem é a honestidade. Onde deixa a desejar: a superfície do plano é Markdown, não editável como uma lista estruturada.

Cursor, interface de agente como programador em pares ambiental

O agente do Cursor parece invisível até que você precise dele, o que representa o ápice da criação de interfaces de agente. Pequenas edições acontecem automaticamente e mostram as diferenças. Refatorações complexas em vários arquivos revelam um plano. A vantagem é a calibração da presença: o Cursor dimensiona a visibilidade do agente de acordo com a tarefa. A desvantagem: a superfície do plano para refatorações complexas se assemelha mais a um chat do que a uma lista de tarefas editável.

Devin, interface de agente como espaço de trabalho interativo

O Devin exibe todo o espaço de trabalho do agente, incluindo um navegador, terminal e editor em tempo real, e a aposta é que a transparência gera confiança mais rapidamente do que a abstração. Um plano estruturado e editável é visível desde o início. Todo o espaço de trabalho é o fluxo de progresso. O usuário assume o controle em qualquer nível. A vantagem é a visibilidade completa. A desvantagem: o espaço de trabalho é pesado para tarefas simples.

Linear IA, interface do agente como assistente integrado

Os recursos de IA do Linear residem na superfície existente do Linear, o que é o padrão ideal para agentes integrados que devem se comportar como um membro da equipe, e não como um aplicativo separado. A IA retorna um artefato estruturado (um problema, um comentário, uma atualização de status) que reside dentro do fluxo existente. A vantagem é a integração. Onde deixa a desejar: tarefas autônomas com várias etapas precisam de uma superfície de planejamento e um fluxo de progresso. O Linear ainda não foi lançado.

ChatGPT Operador, interface do agente como navegador supervisionado

O Operador é executado em um navegador isolado que o usuário pode observar, pausar e assumir o controle, o que é o padrão ideal para agentes que interagem com a web aberta. O navegador em tempo real é o fluxo de progresso. Pagamentos e ações que afetam a conta são controlados. A vantagem é o próprio padrão de navegador supervisionado, que prioriza a confiabilidade em detrimento da velocidade. Onde deixa a desejar: a superfície de planejamento reside no chat, desacoplada do fluxo de progresso, o que torna a correção de rumo durante a execução mais difícil do que deveria.

Replit Agent, Bolt e v0, interface do agente como tela de construção

Replit Agent, Bolt e v0 seguem o mesmo padrão: prompt à esquerda, pré-visualização ao vivo à direita e o trabalho do agente ocorre entre eles. O usuário descreve o que construir, o agente executa até exibir uma pré-visualização. O ponto forte é a tela de construção, que tornou a tarefa abstrata de "construir um aplicativo para mim" algo concreto. Onde cada um deixa a desejar: o Replit Agent oculta muito estado dentro de sua thread. A superfície de planejamento do Bolt para aplicativos complexos é limitada. O loop de iteração do v0 em edições com múltiplos componentes se assemelha mais a um chat do que a um planejamento estruturado. O Lovable, na mesma linha, oferece uma superfície de planejamento mais robusta, mas um fluxo de progresso mais fraco.

Quer uma interface de agente que conquiste a confiança na primeira execução, não na décima? Contrate ⟦MARCA0⟧. A AppBrainy fornece interfaces de usuário para agentes, voltadas para equipes que desenvolvem ferramentas autônomas. A ClaudeBrainy fornece bibliotecas ⟦MARCA0⟧ Habilidades e prompts que otimizam a camada do agente antes mesmo que a interface do usuário precise se adaptar.

Três bugs comuns em interfaces de usuário de agentes e suas soluções

A maioria das interfaces de usuário de agentes são lançadas com os mesmos três bugs, e as soluções não são sutis.

Primeiro: o agente que oculta o plano. O produto recebe uma meta, executa em segundo plano e reporta um resultado. O usuário não tem um plano para revisar, nenhum progresso para acompanhar, nenhuma maneira de interromper a execução. Solução: exibir um plano estruturado e editável antes da execução, mesmo que tenha apenas duas linhas. O custo é de vinte pixels de interface. O benefício é que o usuário pode corrigir o agente antes que ele execute a ação incorreta.

Segundo: o agente que confirma tudo. O produto bloqueia cada ação com um modal, treinando o usuário a clicar sem ler. Quando chega a hora de uma ação destrutiva, o usuário clica nela também. Solução: classificar as ações em reversíveis, destrutivas e catastróficas. Permita apenas os dois últimos e deixe as ações reversíveis serem executadas com um aviso de desfazer de trinta segundos.

Terceiro. O agente que oculta a falha. O produto tenta novamente silenciosamente, ignora erros ou relata "algo deu errado" sem dizer o quê. Solução: exponha cada erro com o ponto de falha, o estado do sistema e opções concretas de recuperação. A confiança vem de falhas honestas, não de falhas ocultas.

Cada correção não é uma reformulação. É a adição ou remoção de uma única superfície até que os padrões possam funcionar corretamente. A maioria dos bugs na interface do agente são problemas de padrão disfarçados de problemas de design.

A lista de verificação de quinze minutos antes do lançamento

Execute isso em qualquer interface de agente antes que ela entre em contato com um usuário real e você identificará os padrões que falham em produção.

  1. Enquadramento da tarefa. Digite um objetivo típico. A entrada impõe estrutura suficiente para que o agente aja de acordo com ela?

  2. Visibilidade da autonomia. Você consegue saber em um segundo o que o agente fará sem perguntar?

  3. Superfície de planejamento. Execute uma tarefa não trivial. O agente exibe um plano estruturado e editável antes de agir?

  4. Transparência do progresso. As chamadas de ferramentas e edições de arquivos são visíveis ou o fluxo é um resumo no estilo de um chat?

  5. Possibilidade de pausa. Tente pausar um agente em execução. O botão de pausa é visível e imediato?

  6. Triagem de confirmação. As ações reversíveis são executadas livremente, as ações destrutivas são bloqueadas por um modal e as ações catastróficas exigem uma confirmação digitada?

  7. Visibilidade de erros. Force uma falha. A interface do usuário exibe o erro com um estado e opções de recuperação?

  8. Possibilidade de desfazer. Existe um caminho claro para desfazer em até trinta segundos após uma ação reversível?

  9. Preservação do estado. Falhe em uma etapa e tente novamente. O trabalho anterior é preservado?

  10. Artefato de transferência. Interrompa uma tarefa no meio da execução. Existe um despejo de estado do qual a próxima pessoa possa continuar?

  11. Registro de uso de ferramentas. O registro é estruturado e legível por máquina ou mistura raciocínio e ações? 12. Botão de desativação. Ele está sempre visível ou fica oculto em um menu de configurações?

Um produto que atenda a esses doze critérios possui uma interface de usuário funcional para agentes. O usuário saberá o que o agente está fazendo e como interrompê-lo.

Perguntas Frequentes

O que é design de interface de usuário para agentes de IA?

O design de interface de usuário para agentes de IA é a disciplina de construção de interfaces para trabalhadores autônomos de IA que recebem uma meta, planejam etapas e executam ferramentas sem aprovação individual para cada etapa. Diferentemente das interfaces de chat, as interfaces de usuário para agentes são superfícies de controle com sete padrões principais: enquadramento de tarefas, controles de autonomia, superfícies de planejamento, fluxos de progresso, portões de confirmação, recuperação de erros e transferência de agentes.

Qual a diferença entre uma interface de usuário para agente de IA e uma interface de usuário para chatbot?

Uma interface de chatbot pressupõe uma conversa passo a passo. Uma interface de usuário para agente pressupõe que o agente seja executado em segundo plano, execute várias chamadas de ferramentas, modifique o estado e reporte quando algo precisar de intervenção humana. As interfaces de usuário para agentes precisam de superfícies de planejamento, fluxos de progresso em tempo real, portões de confirmação e botões de desativação que as interfaces de chat não possuem.

Quais são os principais padrões para projetar interfaces de agentes de IA?

Sete padrões: enquadramento de tarefas, controles de autonomia, superfície de planejamento, fluxo de progresso, portões de confirmação, recuperação de erros e transferências de agentes. Dimensionados para a tarefa, calibrados para confiança e suportados por um eficiência de contexto robusto na camada de modelo.

Quais produtos de agentes de IA têm o melhor design de interface?

Claude Code se destaca em transparência. Cursor se destaca em calibração de presença. Devin se destaca em visibilidade do espaço de trabalho. Linear AI se destaca em incorporação. ChatGPT Operator se destaca em execução supervisionada. Replit Agent, Bolt e v0 se destacam no padrão de tela de construção. Nenhum deles oferece todos os sete padrões em sua totalidade, e é por isso que a categoria ainda está em aberto.

Como equilibrar autonomia e controle em uma interface de agente?

Torne a autonomia uma configuração visível e ajustável por sessão, por tarefa, por ferramenta. Classifique as ações em reversíveis (executadas livremente com a opção de desfazer), destrutivas (bloqueadas por um modal) e catastróficas (bloqueadas com uma confirmação digitada). Exiba o plano antes da execução e o progresso durante a execução. Permita que o usuário pause, assuma o controle ou interrompa a execução a qualquer momento. A confiança aumenta com o poder de intervenção, não com a complexidade oculta.

A mudança que as interfaces de usuário de agentes realmente desbloqueiam

Uma interface de usuário de agente não é um produto de chat com autonomia adicionada; é um novo modelo de interação, e os produtos que a tratam dessa forma são os que estão se destacando.

A maioria das equipes trata a interface de usuário de agente como um recurso adicional ao chat. Elas pegam uma conversa, adicionam um indicador de "pensando", inserem algumas bolhas de uso de ferramentas e chamam isso de agente. O resultado é um chatbot com latência extra. Cada modo de falha do chat se agrava porque o agente agora executa por mais tempo e causa mais danos quando falha.

A mudança consiste em tratar o agente como um trabalhador autônomo e a interface de usuário como a superfície de controle desse trabalhador. O chat se torna um elemento dentro de uma interface maior, que inclui um quadro de planejamento, um fluxo de progresso, um botão de autonomia, um modal de confirmação, um console de erros e um artefato de transferência. O usuário deixa de ser o interlocutor do agente e passa a ser o supervisor.

Se sua equipe está implementando um agente que exige atenção excessiva dos usuários ou confiança cega, o problema quase sempre reside em padrões de comportamento. A solução está nos sete padrões acima, dimensionados para a tarefa, calibrados para gerar confiança e integrados a uma interface real fluxo de trabalho de design de IA, em vez de serem adicionados posteriormente.

Se você deseja uma interface de usuário para agentes que conquiste a confiança logo na primeira tentativa, em vez da décima, contratar ⟦MARCA0⟧, a AppBrainy oferece interfaces de usuário completas para agentes, voltadas para equipes que desenvolvem ferramentas autônomas. A ClaudeBrainy oferece fluxos de trabalho ⟦MARCA0⟧, pacotes de habilidades e bibliotecas de prompts que otimizam a camada do agente, dispensando a necessidade de ajustes na interface do usuário.

Want an agent UI that earns trust on the first run, not the tenth? Brainy ships ClaudeBrainy as a Skill pack and prompt library, and AppBrainy ships full agent product UI for teams building autonomous tools they want their users to actually use.

Get Started