ai for designersMay 29, 20268 min read

Níveis de Esforço do Claude: Do Fast Mode ao Ultracode

Um guia direto sobre os níveis de esforço do Claude para designers e criadores: fast mode, think e ultrathink, níveis de code-review e ultracode, com uma regra simples para saber quando usar cada um.

By Boone
XLinkedIn
claude effort levels

Esforço é um dial, não um padrão. A habilidade está em saber para qual lado girá-lo.

A maioria dos designers que usam o Claude o trata como um interruptor de luz, ligado ou desligado. Eles digitam um prompt, recebem uma resposta e seguem em frente. Isso funciona até o Claude atropelar um caso limite que importa, ou gastar quatro minutos em uma pergunta que precisava de dois segundos. A ferramenta tem configurações, e a maioria das pessoas nunca as toca.

Aqui está o que essas configurações realmente fazem.

O que esforço realmente significa no Claude

Esforço, nos termos do Claude, é o quanto o modelo raciocina antes de responder. Pouco esforço significa que o Claude vai direto para uma resposta, combinando padrões com o que já sabe. Muito esforço significa que o Claude pensa através do problema, considera contra-argumentos e verifica o próprio trabalho antes de responder.

Mais raciocínio leva mais tempo e mais tokens. Esse é o trade-off. A questão nunca é "devo usar esforço alto?" A questão é "esta tarefa realmente precisa disso?"

O dial de esforço, do mais baixo ao mais alto

O Claude Code oferece várias configurações distintas, de quase instantâneo a uma revisão completa com múltiplos agentes. Elas não são versões lineares da mesma coisa. Cada nível muda o que o Claude realmente faz:

NívelComo invocarO que muda
Fast mode/fastOpus, saída mais rápida; melhor para tarefas bem definidas e de baixa ambiguidade
Padrão(sem flag)Raciocínio padrão, lida com a maioria das tarefas
Thinkthink no promptUma passagem de raciocínio antes de responder
Think hardthink hard no promptPassagem mais profunda, mais consideração de casos limite
Think harderthink harder no promptRaciocínio estendido, examina as próprias suposições
Ultrathinkultrathink no promptOrçamento máximo de raciocínio estendido
Code review/code-review + nívelDe baixo a ultra; ultra roda uma passagem multi-agente na nuvem
UltracodeModo permanenteWorkflows multi-agente por padrão para todas as tarefas substanciais

A etapa do padrão ao ultrathink é um aumento na profundidade de raciocínio. A etapa para o ultracode é estrutural: o Claude não está mais respondendo a partir de uma única janela de contexto. Ele cria e executa workflows multi-agente, o que significa múltiplas passagens e múltiplos sub-agentes verificando o trabalho uns dos outros.

Visão geral da documentação do Claude Code, a superfície real do produto onde esses controles de esforço ficam.
Visão geral da documentação do Claude Code, a superfície real do produto onde esses controles de esforço ficam.

Veja em docs.claude.com

Fast mode: quando menos é mais

/fast diz ao Claude para produzir resultados mais rápido. Ele ainda usa o Claude Opus, não um modelo simplificado. Você não está trocando qualidade por velocidade no sentido de obter um modelo mais fraco. Você está trocando profundidade de consideração por throughput.

Conceito voxel de uma bifurcação na estrada: uma faixa rápida e curta versus uma passagem profunda com múltiplos nós.
Conceito voxel de uma bifurcação na estrada: uma faixa rápida e curta versus uma passagem profunda com múltiplos nós.

O fast mode se justifica em tarefas bem definidas onde a resposta não é ambígua: renomear este componente, escrever uma linha de assunto para este e-mail, me dê cinco combinações de fontes para um layout editorial brutalista. O espaço de saída é restrito. Mais raciocínio não melhoraria a resposta.

Onde o fast mode falha é em tarefas com complexidade oculta. "Corrija a estrutura de tokens do meu design system" soa bem definido. Não é. Rode isso no fast mode e o Claude vai otimizar para o óbvio, perder a cadeia de dependências que importava e criar trabalho de limpeza.

Think e ultrathink: raciocínio sob demanda

As palavras-chave think, think hard, think harder e ultrathink desbloqueiam níveis crescentes de raciocínio. Coloque-as no prompt. "Ultrathink sobre a melhor forma de estruturar esta biblioteca de componentes para uma equipe de dez." O Claude reserva mais computação antes de responder.

Cada nível é um degrau real:

  • think executa uma passagem de raciocínio
  • think hard vai mais fundo nos casos limite
  • think harder começa a questionar seu próprio enquadramento
  • ultrathink usa o orçamento máximo de raciocínio disponível antes de responder
Escada voxel de níveis de esforço subindo da esquerda para a direita, do fast na base ao ultracode no topo.
Escada voxel de níveis de esforço subindo da esquerda para a direita, do fast na base ao ultracode no topo.

A maior parte do trabalho diário de design não precisa disso. Nomear uma camada, escrever uma descrição, resumir um briefing de cliente, essas são tarefas de fast mode ou padrão. Mas quando um problema é genuinamente difícil, o espaço de solução é amplo, ou uma resposta ruim custa tempo real para desfazer, elevar o dial de raciocínio compensa imediatamente.

Bons candidatos para o ultrathink:

  • Escolher entre duas arquiteturas de design system fundamentalmente diferentes
  • Escrever um briefing criativo onde o território da marca é ambíguo
  • Revisar uma estratégia de precificação para um produto com posicionamento incomum (relevante se você está trabalhando em precificação de trabalho assistido por IA)
  • Depurar por que um componente do Figma se comporta de forma inesperada em diferentes breakpoints

Maus candidatos: qualquer coisa com uma única resposta clara.

Code review: de uma passagem rápida ao ultra

A flag /code-review do Claude Code tem seu próprio sistema de esforço por níveis: low, medium, high, max e ultra. Isso é separado das palavras-chave de raciocínio.

Low e medium retornam apenas resultados de alta confiança. O Claude sinaliza o que tem certeza e fica quieto no resto. High até max ampliam progressivamente a cobertura, trazendo mais problemas potenciais, incluindo aqueles sobre os quais o Claude está menos certo. Ultra é categoricamente diferente: executa uma revisão profunda com múltiplos agentes na nuvem, o que significa que vários sub-agentes passam o código entre eles e verificam diferentes modos de falha.

NívelO que retornaQuando usar
LowApenas bugs de alta confiançaVerificação rápida antes do commit
MediumAlta confiança mais alguma coberturaRevisão de PR rotineira
HighCobertura ampla, limiar de certeza menorAntes de enviar para staging
MaxExaustivo, achados de baixa certeza incluídosGrandes refatorações, caminhos críticos
UltraRevisão multi-agente na nuvemCódigo sensível à segurança ou que exige alta precisão

Para designers trabalhando com código, low ou medium é o uso diário. Ultra é para a sessão em que você está prestes a publicar uma página de checkout com token-gate e um bug significa uma venda perdida.

Ultracode: a configuração máxima

Ultracode é um modo permanente, não uma palavra-chave por prompt. Quando está ativo, o Claude cria e executa workflows multi-agente por padrão para tarefas substanciais, com múltiplos agentes que planejam, escrevem, verificam e revisam. O custo é tempo e tokens. O retorno é uma minuciosidade que uma resposta de passagem única não consegue alcançar.

Isso não é "o Claude pensando mais tempo." É uma mudança estrutural. O Ultracode é adequado quando a precisão importa mais do que o custo de tokens: publicar uma biblioteca de componentes de design system de produção, implementar um plugin completo do Figma a partir de especificações, arquitetar um pipeline de conteúdo que rodará sem supervisão.

Como combinar esforço com a tarefa

A regra de decisão são duas perguntas:

Qual é o custo de uma resposta ruim? Baixo custo, facilmente reversível: use fast ou padrão. Alto custo, difícil de desfazer, vai para clientes, toca produção: use mais esforço.

Qual é a amplitude do espaço de solução? Uma resposta óbvia: fast ou padrão. Muitas opções válidas com trade-offs reais: think até ultrathink. Espaço de solução amplo mais execução em múltiplas etapas: ultracode.

Conceito voxel de decisão: um cubo pequeno e rápido para trabalho de baixo risco ao lado de uma torre alta para tarefas ambíguas e de risco.
Conceito voxel de decisão: um cubo pequeno e rápido para trabalho de baixo risco ao lado de uma torre alta para tarefas ambíguas e de risco.

Veja como as tarefas comuns de criadores mapeiam para o dial:

TarefaEsforço recomendadoPor quê
Renomear uma camada ou componente no FigmaFastUma resposta certa, risco zero
Escrever cinco variações de títuloFast ou padrãoTarefa limitada, fácil de iterar
Escrever uma proposta para clientePadrão ou thinkTom e posicionamento importam
Escolher entre duas abordagens de design systemThink hard ou ultrathinkEspaço amplo de solução, alto custo de escolha errada
Auditar uma biblioteca de componentes completaUltrathink ou ultracodePrecisa de cobertura sistemática, não de uma passagem rápida
Publicar um plugin do Figma em produçãoUltracodePrecisão necessária, execução em múltiplas etapas
Verificação de código antes do commitCode review: lowVelocidade supera cobertura aqui
Fluxo de checkout sensível à segurançaCode review: ultraUm bug é um bug caro

Para contexto mais amplo sobre onde essas escolhas se encaixam em um workflow diário com IA, veja mais sobre IA para designers.

Quando alto esforço sai pela culatra

Colocar o esforço no máximo nem sempre é a escolha certa. Dois modos de falha aparecem constantemente.

O primeiro é super-engenheirar respostas simples. Pergunte "qual fonte combina bem com Helvetica?" no ultrathink e o Claude escreve uma dissertação. Você precisava de três nomes de fontes. Alto esforço de raciocínio em uma tarefa estreita produz uma saída verbosa e excessivamente cautelosa que você precisa filtrar para encontrar a resposta real.

Conceito voxel de exagero: uma pilha de esforço imponente apontada para um cubo minúsculo.
Conceito voxel de exagero: uma pilha de esforço imponente apontada para um cubo minúsculo.

O segundo é desacelerar o trabalho exploratório. Se você está em uma fase generativa, produzindo opções e rejeitando-as rapidamente, o alto esforço trabalha contra você. Você quer volume e velocidade, não profundidade por opção. O modo padrão ou fast gera mais candidatos por hora do que o ultrathink.

O sinal a observar: se você se pegar passando os olhos pela resposta do Claude procurando a parte útil, o nível de esforço provavelmente está alto demais para a tarefa. Reduza o dial. Obtenha a resposta, não o tour de raciocínio.

FAQ

As palavras-chave de esforço funcionam fora do Claude Code?

Sim. think, think hard, think harder e ultrathink são instruções no nível do prompt que funcionam em qualquer lugar que você use o Claude, incluindo o app Claude no navegador. /fast e /code-review são comandos de barra específicos do Claude Code.

O fast mode usa um modelo diferente?

Não. O fast mode ainda usa o Claude Opus, apenas produz resultados mais rápido porque o Claude faz menos raciocínio interno antes de responder. Você não está recebendo um modelo menor, está recebendo menos passagens de raciocínio antes de a resposta chegar.

Quando um designer realmente deve usar o ultracode?

Quando a tarefa é grande o suficiente e crítica o suficiente em termos de precisão para que você precisaria rodar múltiplas sessões sequenciais do Claude para chegar lá. Um pipeline completo de design-token-to-code. Um plugin completo do Figma com múltiplos estados de interação. Se você consegue terminar em um único prompt bem definido, o ultracode é exagero.

Posso definir um nível de esforço padrão persistente?

Ultracode é um modo permanente que continua ativo durante uma sessão depois de configurado. As palavras-chave de raciocínio são por prompt. /fast alterna para a sessão. Não há configuração global persistente para as palavras-chave de raciocínio entre sessões.

O que realmente muda entre ultrathink e think hard?

Orçamento de raciocínio. Ambos são raciocínio de passagem única, não multi-agente. O Ultrathink aloca significativamente mais computação para essa passagem única, então o Claude consegue seguir cadeias mais longas de lógica e examinar mais casos limite antes de se comprometer com uma resposta. A diferença visível é um raciocínio mais longo e completo antes da saída final.

Alto esforço tornará a saída mais criativa?

Não de forma confiável. A criatividade na saída do Claude se correlaciona mais com o enquadramento do prompt e os exemplos que você fornece do que com o esforço de raciocínio. O Ultrathink ajuda quando o espaço de solução é analiticamente complexo. Ele não faz a saída ser automaticamente mais original.

Pare de deixar o dial no padrão

A maioria das pessoas roda o Claude no mesmo nível de esforço todos os dias, independentemente do que está fazendo. Elas deixam velocidade na mesa durante o trabalho rotineiro e sub-raciocinam em problemas genuinamente difíceis. Os controles existem. Use-os.

O fio condutor é este: fast e padrão lidam com a maior parte do trabalho criativo sem intervenção. As palavras-chave de raciocínio entram quando o problema é genuinamente ambíguo ou o custo de uma resposta errada é alto. Ultracode é para quando a minuciosidade importa mais do que a velocidade e a tarefa é grande o suficiente para justificar a execução multi-agente. Os níveis de code review oferecem uma verificação proporcional, de uma passagem rápida antes do commit a uma varredura de segurança multi-agente.

Ajuste o dial para a tarefa. Não para o hábito.

Brainy helps designers put AI to work without losing the craft. See what we are building for creators.

Get Started

More from Brainy Papers

Keep reading