ai for designersJune 10, 20268 min read

Claude Fable 5: Dados de Lançamento, Benchmarks e Reações Reais

Claude Fable 5 foi lançado em 9 de junho como o primeiro modelo Mythos-class da Anthropic. Os benchmarks verificados, o preço real e o que os desenvolvedores encontraram na primeira semana.

By Boone
XLinkedIn
claude fable 5

Claude Fable 5: Dados de Lançamento, Benchmarks e Reações Reais

Fable 5 é o modelo mais capaz que a Anthropic já disponibilizou ao público em geral. Os benchmarks de terceiros confirmam isso. O problema não é o modelo: é a camada de proteção sobre ele, e um prazo de 22 de junho que a maioria das coberturas enterrou.

Aqui está tudo confirmado até 10 de junho, um dia após o lançamento, com fontes identificadas.

O que Claude Fable 5 realmente é

Fable 5 é o primeiro modelo Mythos-class da Anthropic disponibilizado para uso geral. O nível Mythos-class fica acima do Opus na hierarquia de capacidade da Anthropic, com a própria nota de rodapé da Anthropic descrevendo como "um nível de modelos Claude que fica acima da nossa classe Opus em capacidade." Fable 5 é a versão pública, com proteções de política, desse nível.

Página inicial da Anthropic anunciando o Claude Fable 5 como o primeiro modelo público Mythos-class.
Página inicial da Anthropic anunciando o Claude Fable 5 como o primeiro modelo público Mythos-class.

Veja o anúncio em anthropic.com

Claude Mythos 5 é o mesmo modelo subjacente com certas proteções removidas em áreas específicas de pesquisa. Está em lançamento limitado via Project Glasswing, começando com parceiros de segurança cibernética e se expandindo para pesquisadores selecionados de biologia. Não é um framework de benchmark ou uma arquitetura separada. É o Fable 5 com menos restrições.

O enquadramento da Anthropic para a diferença de capacidade: "Quanto mais longa e complexa a tarefa, maior a vantagem do Fable 5 sobre nossos outros modelos." Esse é o sinal que vale ler com atenção.

Vídeo de lançamento oficial da Anthropic, 371K visualizações nas primeiras 12 horas.

Os dados de benchmark, verificados

Terceiros independentes confirmaram as principais afirmações de codificação em 24 horas. Cada linha abaixo tem uma fonte identificada.

BenchmarkFable 5Opus 4.8Comparação
SWE-Bench Pro80,3%69,2%GPT-5.5 em 58,6%, Gemini 3.1 Pro em 54,2% (The Decoder, com base em gráficos da Anthropic)
FrontierCode Diamond29,3%13,4% geração anterior#1 no FrontierCode "mesmo com esforço médio" (Cognition)
CursorBench72,9%n/a8 pontos acima do melhor anterior (Cursor)
Terminal-Bench 2.188,0%n/a4,6 pontos acima do GPT-5.5 (Cline)
AI Intelligence Index65n/aClassificado em #1, ~60 tok/s mediano, US$ 8,20 preço combinado (Artificial Analysis)
Hebbia Finance BenchmarkO mais alto de qualquer modelon/aAnúncio da Anthropic
Relatório de lançamento do Artificial Analysis classificando o Claude Fable 5 em primeiro no seu Intelligence Index e no ranking GDPval-AA.
Relatório de lançamento do Artificial Analysis classificando o Claude Fable 5 em primeiro no seu Intelligence Index e no ranking GDPval-AA.

Leia o ranking completo em artificialanalysis.ai

O estudo de caso da Stripe é o sinal mais concreto do mundo real. Em uma base de código Ruby de 50 milhões de linhas, o Fable 5 concluiu uma migração completa em um dia que a Anthropic afirma que levaria mais de dois meses para uma equipe humana.

Ainda sem confirmação até 10 de junho, portanto trate como não verificado:

  • LMArena: registrado, sem pontuação Elo pública ainda
  • Aider leaderboard: sem entrada
  • ARC-AGI: sem entrada
  • Replicação comunitária do SWE-bench: ainda em andamento

Preços e o prazo de 22 de junho

ParâmetroFable 5Opus 4.8Sonnet 4.6
Preço de entrada por MTokUS$ 10US$ 5US$ 3
Preço de saída por MTokUS$ 50US$ 25US$ 15
Janela de contexto1M tokens1M tokens1M tokens
Máximo de tokens de saída128K128K64K
Modo de raciocínioAdaptativo, sempre ativoAdaptativoEstendido + adaptativo

O preço da API é direto, exatamente o dobro do Opus 4.8. A Anthropic observa que é "menos da metade do preço do Claude Mythos Preview", o lançamento limitado anterior.

Para usuários de assinatura, o próprio seletor do Claude Code diz que o Fable 5 "usa seus limites ~2x mais rápido que o Opus."

A janela: o Fable 5 está incluído nos planos Pro, Max, Team e Enterprise desde o lançamento até 22 de junho sem custo adicional. A partir de 23 de junho, requer créditos de uso nesses planos. O acesso à API não é afetado.

Simon Willison testou os cinco níveis de esforço no primeiro dia usando seu benchmark de pelicano em SVG, e a variação é instrutiva:

  • Esforço baixo: 9,67 centavos por execução
  • Esforço máximo: 72,175 centavos por execução
  • Seu total acumulado no meio do dia: US$ 82,92 em tokens com preço de API, ainda cobertos por sua assinatura Max

Se você quiser ver como os níveis de esforço se relacionam com os gastos antes de se comprometer, o post dele e a análise dos níveis de esforço são o caminho mais rápido.

O que a internet realmente pensa

O thread de lançamento no HN ultrapassou 2.100 pontos e 1.650 comentários em seu primeiro dia. Está entre os maiores threads de lançamento de modelos na memória recente.

Thread de lançamento do Hacker News para o Claude Fable 5 ultrapassando 2.100 pontos no primeiro dia.
Thread de lançamento do Hacker News para o Claude Fable 5 ultrapassando 2.100 pontos no primeiro dia.

Leia o thread completo em news.ycombinator.com

As vozes mais citadas, em ordem de alcance:

  • Andrej Karpathy (20.400 curtidas, 1,7M visualizações): "um salto qualitativo que merece uma nova versão principal." Ele acrescentou que você pode dar a ele tarefas mais ambiciosas e "o modelo 'entende' e simplesmente executa." Ele também sinalizou: "as proteções estão configuradas para serem excessivamente reativas para o lançamento."
  • artursapek (HN): "Fable 5 supera o GPT 5.5 no meu benchmark de revisão de texto. E faz isso com aproximadamente o mesmo custo total."
  • Simon Willison (HN): Chamou o modelo de "uma fera" no thread, dizendo que estava jogando nele problemas nos quais vinha "procrastinando há meses."
  • Reddit ("Claude Fable 5 parece menos um lançamento de modelo e mais uma prévia da desigualdade na IA"): Críticas organizadas em torno do prazo de 22 de junho como uma divisão rígida de acesso.

O vídeo de lançamento oficial chegou a 371K visualizações nas primeiras 12 horas aproximadamente, com os principais breakdowns de criadores atingindo 73K, 66K e 48K visualizações na mesma janela.

O imposto das proteções

Os classificadores são a verdadeira armadilha do lançamento, e a maioria das coberturas os ignorou. Quando um dispara, a API retorna HTTP 200 com um motivo de parada de recusa e reverte silenciosamente para o Opus 4.8.

Análise de primeiro dia de Simon Willison descrevendo os gatilhos de proteção do Fable 5 e o fallback automático de modelo.
Análise de primeiro dia de Simon Willison descrevendo os gatilhos de proteção do Fable 5 e o fallback automático de modelo.

Leia as primeiras impressões de Simon Willison em simonwillison.net

O usuário pode não ser avisado. A Anthropic diz que isso acontece em menos de 5% das sessões, mas os casos do primeiro dia que surgiram são instrutivos.

Casos do primeiro dia do thread:

  • matheusmoreira (HN): Uma revisão de código Lisp interrompida no meio da sessão por um flag do classificador e uma troca não anunciada para o Opus 4.8.
  • arkwin (HN): Um membro verificado do Cyber Verification Program fazendo pesquisa legítima de vulnerabilidade e encontrando erros de violação de política.
  • Elie Bakouch (Hugging Face, 1,79M visualizações): Criticou a Anthropic por tornar o modelo deliberadamente pior em tarefas de "pesquisa frontier de llm", e por manter essa intervenção invisível ao usuário.

A Anthropic é transparente sobre isso ser deliberado. Dianne Penn, chefe de gestão de produtos para pesquisa da Anthropic, disse à CNBC que a equipe queria "ser muito intencional sobre a construção de novos tipos de classificadores e novos tipos de proteções de segurança para este lançamento."

O escopo do classificador pode se estreitar após o lançamento. A política não vai se tornar uma correção de bug, porque não é um bug.

Um bloqueador separado: o Fable 5 é um Covered Model com requisito de retenção de dados de 30 dias. Não há opção de retenção zero de dados. Usuários do Zed e do GitHub Copilot for Business sinalizaram isso imediatamente como um bloqueador rígido de adoção para ambientes que exigem ZDR.

O que designers devem fazer com o Fable 5

A Anthropic aponta visão e trabalho agêntico de longo horizonte como as principais melhorias do Fable 5. Para designers, isso significa refatorações completas de design system, execuções multi-arquivo de Figma para código, e sessões agênticas que antes desmoronavam após uma hora, exatamente os fluxos de trabalho cobertos em Claude Code para trabalho de design e fluxos de trabalho de design agêntico.

O enquadramento prático do Karpathy é o takeaway mais útil. Expanda o escopo do brief, não do prompt.

O Fable 5 não é melhor em respostas curtas. É melhor em manter uma tarefa grande e complexa em contexto e realmente concluí-la. Se você vinha enviando componentes um de cada vez porque não confiava que o modelo manteria o sistema inteiro, agora é hora de testar o sistema inteiro.

Teste isso antes de 22 de junho, em ordem do que revelará mais:

  • Uma migração completa de biblioteca de componentes em uma única sessão
  • Uma auditoria de design tokens em múltiplos arquivos com saída estruturada
  • Uma execução de descrição Figma para código em um layout com 10 ou mais componentes
  • Qualquer fluxo de trabalho agêntico longo que antes travava com o contexto cheio

Comparado ao que o Opus 4.8 mudou, o Fable 5 estende esses mesmos padrões para sessões mais longas e escopos maiores. O teto subiu. A abordagem é a mesma.

Ilustração em voxel da estação de trabalho de um designer em iluminação de estúdio bronze escuro com destaque ciano.
Ilustração em voxel da estação de trabalho de um designer em iluminação de estúdio bronze escuro com destaque ciano.

FAQ

Qual é a diferença entre Claude Fable 5 e Claude Mythos 5?

Mesmo modelo subjacente. O Fable 5 tem classificadores de segurança ativos para uso geral. O Mythos 5 tem alguns desses classificadores removidos para parceiros de pesquisa verificados via Project Glasswing, começando com parceiros de segurança cibernética. O Mythos 5 não está disponível ao público.

Quando o Claude Fable 5 foi lançado?

9 de junho de 2026. O anúncio está em anthropic.com/news/claude-fable-5-mythos-5.

Qual é o ID do modelo para a API?

claude-fable-5 na API Claude e no Vertex AI. anthropic.claude-fable-5 no Amazon Bedrock.

Qual é a janela de contexto?

1 milhão de tokens por padrão, com até 128K tokens de saída por requisição. É o mesmo contexto do Opus 4.8 e o dobro da saída máxima do Sonnet.

O Fable 5 está na minha assinatura Claude agora?

Sim, até 22 de junho sem custo adicional nos planos Pro, Max, Team e Enterprise. A partir de 23 de junho, requer créditos de uso nesses planos. O preço da API não é afetado.

O que acontece quando o classificador dispara?

A API retorna HTTP 200 com stop_reason "refusal" e muda para o Opus 4.8. A Anthropic diz que acontece em menos de 5% das sessões. O fallback nem sempre é visível ao usuário.

O Fable 5 suporta retenção zero de dados?

Não. É um Covered Model com requisito de retenção de dados de 30 dias. Isso é um bloqueador rígido para ambientes empresariais com requisitos ZDR.

Qual é o cutoff de conhecimento do Fable 5?

A Anthropic não publicou um para o Fable 5 até 10 de junho.

O modelo está pronto antes das regras

Os benchmarks são reais, o desempenho de codificação é confirmado por múltiplas fontes independentes, e o estudo de caso da Stripe é o sinal mais concreto do que capacidade de longo horizonte realmente significa em produção. Este é o melhor modelo que a Anthropic já disponibilizou ao público.

A leitura honesta sobre as lacunas: o comportamento do classificador é uma escolha de política deliberada sobre a qual a Anthropic é transparente, o bloqueador ZDR é estrutural, e a janela de 22 de junho é um prazo real. Nada disso cancela a capacidade. Tudo isso molda quando e como você pode realmente usá-lo.

Teste agora, nos fluxos de trabalho que importam, antes que a janela de assinatura feche. A capacidade está lá. A camada de política ainda está sendo calibrada.

Brainy creators get briefs, tools, and an audience of 2M+ designers. If you are already building with models like Fable 5, come build with us.

Get Started

More from Brainy Papers

Keep reading