ai for designersMay 29, 20268 min read

Claude Effort Levels: Von Fast Mode bis Ultracode

Ein verständlicher Leitfaden zu Claudes Effort Levels für Designer und Kreative: Fast Mode, Think und Ultrathink, Code-Review-Stufen und Ultracode, mit einer einfachen Regel, wann man was einsetzt.

By Boone
XLinkedIn
claude effort levels

Effort ist ein Regler, kein Standard. Die Kunst besteht darin zu wissen, in welche Richtung man ihn dreht.

Die meisten Designer, die Claude nutzen, behandeln es wie einen Lichtschalter: an oder aus. Sie tippen einen Prompt, bekommen eine Antwort und machen weiter. Das funktioniert, bis Claude an einem wichtigen Grenzfall vorbeihuscht oder vier Minuten für eine Frage aufwendet, die zwei Sekunden gebraucht hätte. Das Tool hat Einstellungen, die die meisten Menschen nie anfassen.

Was diese Einstellungen tatsächlich bewirken.

Was Effort in Claude wirklich bedeutet

Effort bedeutet bei Claude, wie viel das Modell denkt, bevor es antwortet. Geringer Effort bedeutet, dass Claude direkt zur Antwort übergeht und Muster aus seinem Wissen abgleicht. Hoher Effort bedeutet, dass Claude das Problem durchdenkt, Gegenargumente abwägt und seine eigene Arbeit prüft, bevor es antwortet.

Mehr Reasoning braucht mehr Zeit und mehr Tokens. Das ist der Kompromiss. Die Frage lautet nie "Soll ich hohen Effort nutzen?" Die Frage lautet: "Braucht diese Aufgabe das wirklich?"

Der Effort-Regler, von niedrig bis hoch

Claude Code bietet mehrere verschiedene Einstellungen, von nahezu sofortiger Antwort bis zu einem vollständigen Multi-Agent-Review-Durchlauf. Es sind keine linearen Versionen derselben Sache. Jede Stufe verändert, was Claude tatsächlich tut:

LevelAktivierungWas sich ändert
Fast mode/fastOpus, schnellere Ausgabe; ideal für klar umrissene, eindeutige Aufgaben
Standard(kein Flag)Standard-Reasoning, bewältigt die meisten Aufgaben
Thinkthink im PromptEin Reasoning-Durchlauf vor der Antwort
Think hardthink hard im PromptTieferer Durchlauf, mehr Berücksichtigung von Grenzfällen
Think harderthink harder im PromptErweitertes Reasoning, überprüft eigene Annahmen
Ultrathinkultrathink im PromptMaximales erweitertes Reasoning-Budget
Code review/code-review + StufeLow bis Ultra; Ultra führt Multi-Agent-Cloud-Durchlauf durch
UltracodeDauermodusMulti-Agent-Workflows standardmäßig für alle wesentlichen Aufgaben

Der Schritt von Standard zu Ultrathink ist eine Zunahme der Reasoning-Tiefe. Der Schritt zu Ultracode ist strukturell: Claude antwortet nicht mehr aus einem einzigen Kontextfenster. Es entwirft und führt Multi-Agent-Workflows aus, also mehrere Durchläufe und mehrere Sub-Agenten, die gegenseitig die Arbeit prüfen.

Übersicht der Claude Code-Dokumentation, die eigentliche Produktoberfläche, auf der diese Effort-Steuerungen leben.
Übersicht der Claude Code-Dokumentation, die eigentliche Produktoberfläche, auf der diese Effort-Steuerungen leben.

Auf docs.claude.com ansehen

Fast Mode: Wenn weniger mehr ist

/fast weist Claude an, schneller zu antworten. Es verwendet weiterhin Claude Opus, kein abgespecktes Modell. Man tauscht keine Qualität gegen Geschwindigkeit ein, im Sinne eines schwächeren Modells. Man tauscht Überlegungstiefe gegen Durchsatz.

Voxel-Konzept einer Weggabelung: eine kurze schnelle Spur gegenüber einem längeren Multi-Node-Tiefendurchlauf.
Voxel-Konzept einer Weggabelung: eine kurze schnelle Spur gegenüber einem längeren Multi-Node-Tiefendurchlauf.

Fast Mode bewährt sich bei klar definierten Aufgaben, bei denen die Antwort eindeutig ist: Benenne diese Komponente um, schreibe eine Betreffzeile für diese E-Mail, gib mir fünf Schriftkombinationen für ein brutalistisches Redaktionslayout. Der Ausgaberaum ist begrenzt. Mehr Reasoning würde die Antwort nicht verbessern.

Fast Mode versagt bei Aufgaben mit versteckter Komplexität. "Behebe meine Design-System-Token-Struktur" klingt eingegrenzt. Ist es nicht. Führt man das im Fast Mode aus, optimiert Claude für das Offensichtliche, übersieht die Abhängigkeitskette, die wichtig war, und erzeugt Aufräumarbeit.

Think und Ultrathink: Reasoning auf Abruf

Die Keywords think, think hard, think harder und ultrathink schalten zunehmende Reasoning-Stufen frei. Man fügt sie in den Prompt ein. "Ultrathink about the best way to structure this component library for a team of ten." Claude plant mehr Rechenaufwand ein, bevor es antwortet.

Jede Stufe ist ein echter Fortschritt:

  • think führt einen Reasoning-Durchlauf durch
  • think hard geht tiefer in Grenzfälle
  • think harder beginnt, den eigenen Rahmen zu hinterfragen
  • ultrathink nutzt das maximale verfügbare Reasoning-Budget vor der Antwort
Voxel-Leiter der Effort-Stufen, von links nach rechts ansteigend, von Fast an der Basis bis Ultracode an der Spitze.
Voxel-Leiter der Effort-Stufen, von links nach rechts ansteigend, von Fast an der Basis bis Ultracode an der Spitze.

Die meisten alltäglichen Designaufgaben brauchen das nicht. Eine Ebene beschriften, eine Beschreibung schreiben, ein Kundenbriefing zusammenfassen, das sind Fast-Mode- oder Standard-Aufgaben. Aber wenn ein Problem wirklich schwierig ist, der Lösungsraum breit ist oder eine schlechte Antwort echte Zeit zum Rückgängigmachen kostet, zahlt sich das Hochsetzen des Reasoning-Reglers sofort aus.

Gute Kandidaten für Ultrathink:

  • Zwischen zwei grundlegend verschiedenen Design-System-Architekturen wählen
  • Ein kreatives Briefing schreiben, bei dem das Markenterritorium unklar ist
  • Eine Preisstrategie für ein Produkt mit ungewöhnlicher Positionierung überprüfen (relevant, wenn man gerade die Preisgestaltung KI-gestützter Arbeit durcharbeitet)
  • Debuggen, warum eine Figma-Komponente sich über Breakpoints hinweg unerwartet verhält

Schlechte Kandidaten: alles mit einer einzigen klaren Antwort.

Code Review: Vom schnellen Durchlauf bis Ultra

Claude Codes /code-review-Flag hat sein eigenes abgestuftes Effort-System: Low, Medium, High, Max und Ultra. Das ist unabhängig von den Reasoning-Keywords.

Low und Medium liefern nur hoch konfidente Befunde. Claude markiert, was es sicher ist, und schweigt beim Rest. High bis Max erweitern die Abdeckung schrittweise und zeigen mehr potenzielle Probleme auf, einschließlich derer, bei denen Claude weniger sicher ist. Ultra ist kategorial anders: Es führt einen tiefen Multi-Agent-Review in der Cloud durch, wobei mehrere Sub-Agenten den Code untereinander weitergeben und auf verschiedene Fehlermuster prüfen.

StufeWas zurückgegeben wirdWann nutzen
LowNur hoch konfidente BugsSchneller Pre-Commit-Check
MediumHoch konfident plus etwas AbdeckungRoutinemäßiger PR-Review
HighBreite Abdeckung, niedrigere SicherheitsschwelleVor dem Deployment ins Staging
MaxErschöpfend, niedrig konfidente Befunde eingeschlossenGrößere Refactors, kritische Pfade
UltraMulti-Agent-Cloud-ReviewSicherheitskritischer oder hochkorrektheitserfordernder Code

Für Designer, die mit Code arbeiten, ist Low oder Medium der tägliche Begleiter. Ultra ist für die Session, in der man gerade dabei ist, eine token-gesicherte Checkout-Seite zu pushen, und ein einziger Bug einen verlorenen Verkauf bedeutet.

Ultracode: Die maximale Einstellung

Ultracode ist ein Dauermodus, kein Prompt-Keyword. Wenn aktiv, entwirft und führt Claude standardmäßig Multi-Agent-Workflows für wesentliche Aufgaben durch, mit mehreren Agenten, die planen, schreiben, prüfen und überarbeiten. Der Preis ist Zeit und Tokens. Der Gewinn ist Gründlichkeit, mit der eine Einzeldurchlauf-Antwort nicht mithalten kann.

Das ist kein "Claude denkt länger". Es ist ein struktureller Wechsel. Ultracode ist angemessen, wenn Korrektheit wichtiger ist als Token-Kosten: Ausliefern einer Produktions-Design-System-Komponentenbibliothek, Implementierung eines vollständigen Figma-Plugins nach Spezifikation, Architektur einer Content-Pipeline, die unbeaufsichtigt läuft.

Wie man Effort auf die Aufgabe abstimmt

Die Entscheidungsregel lautet zwei Fragen:

Was kostet eine schlechte Antwort? Geringe Kosten, leicht rückgängig zu machen: Fast oder Standard nutzen. Hohe Kosten, schwer rückgängig zu machen, geht an Kunden, berührt die Produktion: höheren Effort nutzen.

Wie breit ist der Lösungsraum? Eine offensichtliche Antwort: Fast oder Standard. Viele valide Optionen mit echten Kompromissen: Think bis Ultrathink. Breiter Lösungsraum plus mehrstufige Ausführung: Ultracode.

Voxel-Entscheidungskonzept: Ein kleiner, schneller Würfel für risikoarme Arbeit neben einem hohen Turm für mehrdeutige, riskante Aufgaben.
Voxel-Entscheidungskonzept: Ein kleiner, schneller Würfel für risikoarme Arbeit neben einem hohen Turm für mehrdeutige, riskante Aufgaben.

So ordnen sich häufige Creator-Aufgaben dem Regler zu:

AufgabeEmpfohlener EffortWarum
Figma-Ebene oder -Komponente umbenennenFastEine richtige Antwort, null Einsatz
Fünf Überschriftenvarianten schreibenFast oder StandardBegrenzte Aufgabe, einfach zu iterieren
Kundenangebot schreibenStandard oder ThinkTon und Positionierung sind entscheidend
Zwischen zwei Design-System-Ansätzen wählenThink hard oder UltrathinkBreiter Lösungsraum, hohe Kosten bei falscher Wahl
Vollständige Komponentenbibliothek prüfenUltrathink oder UltracodeBraucht systematische Abdeckung, keinen schnellen Durchlauf
Produktions-Figma-Plugin ausliefernUltracodeKorrektheit erforderlich, mehrstufige Ausführung
Pre-Commit-Code-CheckCode review: LowGeschwindigkeit schlägt hier Abdeckung
Sicherheitskritischer Checkout-FlowCode review: UltraEin Bug ist ein teurer Bug

Für mehr Kontext, wo diese Entscheidungen in einen täglichen KI-Workflow passen, siehe mehr zu KI für Designer.

Wenn hoher Effort nach hinten losgeht

Den Effort auf Maximum zu stellen ist nicht immer die richtige Entscheidung. Zwei Fehlermuster tauchen ständig auf.

Das erste ist das Overengineering einfacher Antworten. Fragt man "Welche Schrift passt gut zu Helvetica?" mit Ultrathink, schreibt Claude eine Dissertation. Man brauchte drei Schriftnamen. Hoher Reasoning-Aufwand bei einer eng gefassten Aufgabe produziert ausführliche, übermäßig abgesicherte Ausgabe, durch die man sich wühlen muss, um die eigentliche Antwort zu finden.

Voxel-Konzept von Overkill: ein hoch aufragender Effort-Stapel, der auf einen winzigen Würfel zielt.
Voxel-Konzept von Overkill: ein hoch aufragender Effort-Stapel, der auf einen winzigen Würfel zielt.

Das zweite ist das Verlangsamen explorativer Arbeit. Ist man in einer generativen Phase, produziert Optionen und verwirft sie schnell, arbeitet hoher Effort gegen einen. Man will Volumen und Geschwindigkeit, nicht Tiefe pro Option. Standard oder Fast Mode generiert mehr Kandidaten pro Stunde als Ultrathink.

Das Signal, auf das man achten sollte: Wenn man Claudes Antwort überfliegt und nach dem nützlichen Teil sucht, ist der Effort-Level wahrscheinlich zu hoch für die Aufgabe. Den Regler zurückdrehen. Die Antwort bekommen, nicht die Reasoning-Tour.

FAQ

Funktionieren die Effort-Keywords außerhalb von Claude Code?

Ja. think, think hard, think harder und ultrathink sind Prompt-Level-Anweisungen, die überall funktionieren, wo man Claude nutzt, einschließlich der Claude-App im Browser. /fast und /code-review sind Claude Code-spezifische Slash-Befehle.

Nutzt Fast Mode ein anderes Modell?

Nein. Fast Mode nutzt weiterhin Claude Opus, produziert die Ausgabe nur schneller, weil Claude weniger internes Reasoning durchführt, bevor es antwortet. Man erhält kein kleineres Modell, sondern weniger Denk-Durchläufe, bevor die Antwort kommt.

Wann sollte ein Designer Ultracode tatsächlich nutzen?

Wenn die Aufgabe groß genug und korrektheitskritisch genug ist, dass man sonst mehrere aufeinanderfolgende Claude-Sessions durchlaufen würde, um ans Ziel zu kommen. Eine vollständige Design-Token-zu-Code-Pipeline. Ein vollständiges Figma-Plugin mit mehreren Interaktionszuständen. Wenn man es mit einem gut gefassten Prompt abschließen könnte, ist Ultracode übertrieben.

Kann ich einen dauerhaften Standard-Effort-Level festlegen?

Ultracode ist ein Dauermodus, der einmal konfiguriert während einer Session aktiv bleibt. Die Reasoning-Keywords gelten pro Prompt. /fast schaltet für die Session um. Es gibt keine dauerhaften globalen Einstellungen für die Reasoning-Keywords zwischen Sessions.

Was ändert sich wirklich zwischen Ultrathink und Think Hard?

Das Reasoning-Budget. Beide sind Single-Pass-Reasoning, kein Multi-Agent. Ultrathink weist diesem einzelnen Durchlauf deutlich mehr Rechenaufwand zu, sodass Claude längeren Logikketten folgen und mehr Grenzfälle untersuchen kann, bevor es sich auf eine Antwort festlegt. Der sichtbare Unterschied ist längeres, gründlicheres Reasoning vor der endgültigen Ausgabe.

Macht hoher Effort die Ausgabe kreativer?

Nicht zuverlässig. Kreativität in Claudes Ausgabe korreliert stärker mit dem Prompt-Framing und den Beispielen, die man gibt, als mit dem Reasoning-Aufwand. Ultrathink hilft, wenn der Lösungsraum analytisch komplex ist. Es macht die Ausgabe nicht automatisch origineller.

Hör auf, den Regler auf Standard zu lassen

Die meisten Menschen lassen Claude täglich auf demselben Effort-Level laufen, unabhängig davon, was sie tun. Sie verschenken Geschwindigkeit bei Routinearbeit und denken zu wenig bei wirklich schwierigen Problemen. Die Steuerungsmöglichkeiten existieren. Nutze sie.

Der rote Faden: Fast und Standard bewältigen den Großteil der kreativen Arbeit ohne Eingriff. Thinking-Keywords kommen ins Spiel, wenn das Problem wirklich mehrdeutig ist oder die Kosten einer falschen Antwort hoch sind. Ultracode ist für den Fall, dass Gründlichkeit wichtiger ist als Geschwindigkeit und die Aufgabe groß genug ist, um Multi-Agent-Ausführung zu rechtfertigen. Code-Review-Stufen bieten eine proportionale Prüfung, von einem schnellen Pre-Commit-Durchlauf bis zu einem Multi-Agent-Sicherheits-Sweep.

Den Regler auf die Aufgabe einstellen. Nicht auf Gewohnheit.

Brainy helps designers put AI to work without losing the craft. See what we are building for creators.

Get Started

More from Brainy Papers

Keep reading