ai for designersJune 10, 20268 min read

Claude Fable 5: Startdaten, Benchmarks und echte Reaktionen

Claude Fable 5 startete am 9. Juni als Anthropics erstes Mythos-class-Modell. Die verifizierten Benchmarks, die echten Preise und was Entwickler in Woche eins erlebt haben.

By Boone
XLinkedIn
claude fable 5

Claude Fable 5: Startdaten, Benchmarks und echte Reaktionen

Fable 5 ist das leistungsfähigste Modell, das Anthropic bisher für die Öffentlichkeit veröffentlicht hat. Die Drittanbieter-Benchmarks bestätigen das. Der Haken liegt nicht beim Modell selbst: Es ist die Schutzschicht darüber, und eine Abonnement-Frist zum 22. Juni, die die meisten Berichte kaum erwähnt haben.

Hier ist alles, was zum Stand des 10. Juni, einen Tag nach dem Launch, bestätigt ist, mit namentlichen Quellen.

Was Claude Fable 5 eigentlich ist

Fable 5 ist Anthropics erstes Mythos-class-Modell, das für den allgemeinen Gebrauch verfügbar gemacht wird. Mythos-class rangiert in Anthropics Fähigkeitshierarchie über Opus, wobei Anthropics eigene Fußnote es als "eine Klasse von Claude-Modellen, die in Bezug auf Fähigkeiten über unserer Opus-Klasse liegen" beschreibt. Fable 5 ist die öffentliche, richtliniengehärtete Version dieser Klasse.

Anthropic-Homepage mit der Ankündigung von Claude Fable 5 als erstem öffentlichen Mythos-class-Modell.
Anthropic-Homepage mit der Ankündigung von Claude Fable 5 als erstem öffentlichen Mythos-class-Modell.

Zur Ankündigung auf anthropic.com

Claude Mythos 5 ist dasselbe zugrunde liegende Modell, bei dem bestimmte Schutzmaßnahmen in bestimmten Forschungsbereichen aufgehoben wurden. Es ist in begrenztem Umfang über Project Glasswing verfügbar, beginnend mit Cybersecurity-Partnern und mit Ausweitung auf ausgewählte Biologieforscher. Es ist kein Benchmark-Framework und keine separate Architektur. Es ist Fable 5 mit weniger Einschränkungen.

Anthropics Formulierung zum Fähigkeitsgefälle: "Je länger und komplexer die Aufgabe, desto größer ist Fable 5's Vorsprung gegenüber unseren anderen Modellen." Das ist das Signal, das man sorgfältig lesen sollte.

Anthropics offizielles Launch-Video, 371.000 Aufrufe in den ersten 12 Stunden.

Die Benchmark-Daten, verifiziert

Unabhängige Drittparteien bestätigten die wichtigsten Programmier-Behauptungen innerhalb von 24 Stunden. Jede Zeile unten hat eine namentliche Quelle.

BenchmarkFable 5Opus 4.8Vergleich
SWE-Bench Pro80,3 %69,2 %GPT-5.5 bei 58,6 %, Gemini 3.1 Pro bei 54,2 % (The Decoder, aus Anthropic-Charts)
FrontierCode Diamond29,3 %13,4 % vorherige GenerationNr. 1 auf FrontierCode "selbst bei mittlerem Aufwand" (Cognition)
CursorBench72,9 %n/a8 Punkte über dem bisherigen Bestwert (Cursor)
Terminal-Bench 2.188,0 %n/a4,6 Punkte über GPT-5.5 (Cline)
AI Intelligence Index65n/aPlatz 1, ~60 Tok/s Median, 8,20 $ gemischter Preis (Artificial Analysis)
Hebbia Finance BenchmarkHöchster aller Modellen/aAnkündigung von Anthropic
Artificial Analysis Launch-Bericht, der Claude Fable 5 auf dem ersten Platz seines Intelligence Index und GDPval-AA-Leaderboards einordnet.
Artificial Analysis Launch-Bericht, der Claude Fable 5 auf dem ersten Platz seines Intelligence Index und GDPval-AA-Leaderboards einordnet.

Den vollständigen Bericht auf artificialanalysis.ai lesen

Die Stripe-Fallstudie ist das schärfste reale Signal. In einer Ruby-Codebasis mit 50 Millionen Zeilen schloss Fable 5 eine codebaseweite Migration an einem Tag ab, die laut Anthropic ein menschliches Team über zwei Monate gekostet hätte.

Stand 10. Juni noch ausstehend, daher als unbestätigt behandeln:

  • LMArena: registriert, noch kein öffentlicher Elo-Score
  • Aider-Leaderboard: kein Eintrag
  • ARC-AGI: kein Eintrag
  • Community SWE-bench-Replikation: noch ausstehend

Preise und der Haken vom 22. Juni

AchseFable 5Opus 4.8Sonnet 4.6
Eingabepreis pro MTok10 $5 $3 $
Ausgabepreis pro MTok50 $25 $15 $
Kontextfenster1 M Token1 M Token1 M Token
Maximale Ausgabe-Token128 K128 K64 K
Thinking-ModusAdaptiv, immer aktivAdaptivErweitert + adaptiv

Die API-Preise sind unkompliziert, genau das Doppelte von Opus 4.8. Anthropic merkt an, es sei "weniger als halb so teuer wie Claude Mythos Preview", der früheren limitierten Veröffentlichung.

Für Abonnement-Nutzer sagt Claude Code's eigener Picker, dass Fable 5 "Ihre Limits ~2x schneller als Opus aufbraucht."

Das Zeitfenster: Fable 5 ist auf Pro, Max, Team und Enterprise vom Launch bis zum 22. Juni ohne Aufpreis enthalten. Ab dem 23. Juni erfordert es Nutzungsguthaben auf diesen Plänen. Der API-Zugang ist davon nicht betroffen.

Simon Willison testete alle fünf Aufwandsstufen am ersten Tag mit seinem Pelikan-SVG-Benchmark, und die Spanne ist aufschlussreich:

  • Geringer Aufwand: 9,67 Cent pro Durchlauf
  • Maximaler Aufwand: 72,175 Cent pro Durchlauf
  • Sein laufendes Tagesmittel: 82,92 $ in API-berechneten Token, alle noch durch sein Max-Abonnement abgedeckt

Wer sehen möchte, wie Aufwandsstufen den Ausgaben entsprechen, bevor man sich festlegt: sein Beitrag und die Erklärung der Aufwandsstufen sind der schnellste Weg.

Was das Internet tatsächlich denkt

Der HN-Launch-Thread überschritt innerhalb des ersten Tages 2.100 Punkte und 1.650 Kommentare. Das gehört zu den größten Modell-Launch-Threads der jüngeren Vergangenheit.

Hacker News Launch-Thread für Claude Fable 5, der am ersten Tag 2.100 Punkte überschreitet.
Hacker News Launch-Thread für Claude Fable 5, der am ersten Tag 2.100 Punkte überschreitet.

Den vollständigen Thread auf news.ycombinator.com lesen

Die meistzitierten Stimmen nach Reichweite:

  • Andrej Karpathy (20.400 Likes, 1,7 M Aufrufe): "ein Fortschritt, der einen Major-Version-Bump verdient." Er ergänzte, man könne dem Modell ambitioniertere Aufgaben geben, das Modell "kapiert es" und macht einfach weiter. Er merkte auch an: "Die Schutzmaßnahmen sind für den Launch etwas zu empfindlich konfiguriert."
  • artursapek (HN): "Fable 5 schlägt GPT 5.5 in meinem Korrekturlesen-Benchmark. Und das bei ungefähr gleichen Gesamtkosten."
  • Simon Willison (HN): Nannte das Modell im Thread "ein Biest" und sagte, er werfe ihm Probleme vor, die er "seit Monaten vor sich herschiebe."
  • Reddit ("Claude Fable 5 fühlt sich weniger wie ein Modell-Launch an und mehr wie eine Vorschau auf KI-Ungleichheit"): Kritik, die sich um die Frist vom 22. Juni als harte Zugangstrennung organisierte.

Das offizielle Launch-Video erreichte in etwa den ersten 12 Stunden 371.000 Aufrufe, wobei die wichtigsten Creator-Breakdowns im selben Zeitraum 73.000, 66.000 und 48.000 Aufrufe erzielten.

Die Schutzmaßnahmen-Steuer

Die Classifier sind der eigentliche Haken des Launches, und die meisten Berichte haben sie übergangen. Wenn einer auslöst, gibt die API HTTP 200 mit einem Refusal-Stop-Reason zurück und wechselt stillschweigend zu Opus 4.8.

Simon Willisons Ersttagsbewertung, die Fable 5's Guardrail-Auslöser und den automatischen Modellwechsel beschreibt.
Simon Willisons Ersttagsbewertung, die Fable 5's Guardrail-Auslöser und den automatischen Modellwechsel beschreibt.

Simon Willisons ersten Eindruck auf simonwillison.net lesen

Der Nutzer wird möglicherweise nicht informiert. Anthropic sagt, das passiert in weniger als 5 % der Sitzungen, aber die Ersttagsfälle, die aufgetaucht sind, sind aufschlussreich.

Ersttagsfälle aus dem Thread:

  • matheusmoreira (HN): Ein Lisp-Code-Review, das mitten in der Sitzung durch einen Classifier-Flag unterbrochen wurde, mit unangekündigtem Wechsel zu Opus 4.8.
  • arkwin (HN): Ein verifiziertes Mitglied des Cyber Verification Program, das bei legitimer Schwachstellenforschung auf Policy-Violation-Fehler stößt.
  • Elie Bakouch (Hugging Face, 1,79 M Aufrufe): Kritisierte Anthropic dafür, das Modell bei "frontier llm research"-Aufgaben absichtlich schlechter zu machen, und dafür, dass dieser Eingriff für den Nutzer unsichtbar bleibt.

Anthropic ist offen darüber, dass dies bewusst ist. Dianne Penn, Anthropics Leiterin des Produktmanagements für Forschung, sagte gegenüber CNBC, das Team habe "sehr bewusst neue Arten von Classifiern und neue Arten von Sicherheits-Guardrails für diesen Launch entwickeln wollen."

Der Classifier-Umfang könnte sich nach dem Launch einengen. Die Richtlinie wird kein Bug-Fix, denn es ist kein Bug.

Ein weiterer Blocker: Fable 5 ist ein Covered Model mit einer 30-tägigen Datenspeicherungspflicht. Es gibt keine Zero-Data-Retention-Option. Zed- und GitHub Copilot for Business-Nutzer haben das sofort als harten Adoptions-Blocker für Shops mit ZDR-Anforderungen markiert.

Was Designer mit Fable 5 tun sollten

Anthropic nennt Vision und langfristige agentische Arbeit als die wichtigsten Verbesserungen bei Fable 5. Für Designer bedeutet das vollständige Design-System-Refactorings, Multi-File-Figma-to-Code-Läufe und agentische Sitzungen, die bisher nach einer Stunde auseinanderfielen, genau die Workflows, die in Claude Code für Design-Arbeit und agentische Design-Workflows behandelt werden.

Karpathys praktische Neuformulierung ist die nützlichste Erkenntnis. Den Brief erweitern, nicht den Prompt.

Fable 5 ist nicht besser bei Einzeilern. Es ist besser darin, eine große, komplexe Aufgabe im Kontext zu halten und sie tatsächlich abzuschließen. Wer bisher Komponenten einzeln geschickt hat, weil dem Modell nicht zugetraut wurde, das gesamte System zu halten, der sollte jetzt das gesamte System testen.

Das vor dem 22. Juni testen, in der Reihenfolge dessen, was am meisten zeigt:

  • Eine vollständige Komponentenbibliotheks-Migration in einer einzigen Sitzung
  • Ein Multi-File-Design-Token-Audit mit strukturiertem Output
  • Ein Figma-Beschreibungs-zu-Code-Lauf auf einem Layout mit 10 oder mehr Komponenten
  • Jeden langen agentischen Workflow, der bisher bei Kontextfüllung ins Stocken geraten ist

Im Vergleich zu dem, was Opus 4.8 verändert hat, erweitert Fable 5 dieselben Muster auf längere Sitzungen und größere Umfänge. Die Obergrenze wurde verschoben. Der Ansatz ist derselbe.

Voxel-Illustration einer Designer-Workstation in dunkler Bronze-Studiobeleuchtung mit Cyan-Akzent.
Voxel-Illustration einer Designer-Workstation in dunkler Bronze-Studiobeleuchtung mit Cyan-Akzent.

FAQ

Was ist der Unterschied zwischen Claude Fable 5 und Claude Mythos 5?

Dasselbe zugrunde liegende Modell. Fable 5 hat Sicherheits-Classifier für den allgemeinen Gebrauch aktiv. Mythos 5 hat einige dieser Classifier für geprüfte Forschungspartner über Project Glasswing aufgehoben, beginnend mit Cybersecurity-Partnern. Mythos 5 ist nicht öffentlich verfügbar.

Wann wurde Claude Fable 5 gestartet?

Am 9. Juni 2026. Die Ankündigung ist unter anthropic.com/news/claude-fable-5-mythos-5 zu finden.

Was ist die Modell-ID für die API?

claude-fable-5 auf der Claude API und Vertex AI. anthropic.claude-fable-5 auf Amazon Bedrock.

Was ist das Kontextfenster?

Standardmäßig 1 Million Token, mit bis zu 128.000 Ausgabe-Token pro Anfrage. Das ist derselbe Kontext wie Opus 4.8 und doppelte maximale Ausgabe im Vergleich zu Sonnet.

Ist Fable 5 jetzt in meinem Claude-Abonnement?

Ja, bis zum 22. Juni ohne Aufpreis auf Pro, Max, Team und Enterprise. Ab dem 23. Juni erfordert es Nutzungsguthaben auf diesen Plänen. Die API-Preise sind nicht betroffen.

Was passiert, wenn der Classifier auslöst?

Die API gibt HTTP 200 mit stop_reason "refusal" zurück und wechselt zu Opus 4.8. Anthropic sagt, das passiert in weniger als 5 % der Sitzungen. Der Fallback ist nicht immer für den Nutzer sichtbar.

Unterstützt Fable 5 Zero-Data-Retention?

Nein. Es ist ein Covered Model mit einer 30-tägigen Datenspeicherungspflicht. Das ist ein harter Blocker für Unternehmensumgebungen mit ZDR-Anforderungen.

Was ist der Wissens-Cutoff für Fable 5?

Anthropic hat zum 10. Juni keinen Cutoff für Fable 5 veröffentlicht.

Das Modell ist vor den Regeln bereit

Die Benchmarks sind real, die Programmier-Performance wird von mehreren unabhängigen Quellen bestätigt, und die Stripe-Fallstudie ist das konkreteste Signal dafür, was langfristige Fähigkeit in der Produktion tatsächlich bedeutet. Das ist das beste Modell, das Anthropic für die Öffentlichkeit veröffentlicht hat.

Die ehrliche Einschätzung der Lücken: Das Classifier-Verhalten ist eine bewusste Richtlinienentscheidung, über die Anthropic transparent ist, der ZDR-Blocker ist strukturell, und das Zeitfenster bis zum 22. Juni ist eine echte Frist. Das hebt die Fähigkeiten nicht auf. Es formt, wann und wie man sie tatsächlich nutzen kann.

Jetzt testen, bei den Workflows, die wichtig sind, bevor das Abonnement-Fenster schließt. Die Fähigkeit ist vorhanden. Die Richtlinien-Schicht wird noch kalibriert.

Brainy creators get briefs, tools, and an audience of 2M+ designers. If you are already building with models like Fable 5, come build with us.

Get Started

More from Brainy Papers

Keep reading