ai for designersJune 10, 20268 min read

Claude Fable 5: लॉन्च डेटा, बेंचमार्क, और असली प्रतिक्रियाएं

Claude Fable 5 ने 9 जून को Anthropic के पहले Mythos-class मॉडल के रूप में लॉन्च किया। सत्यापित बेंचमार्क, असली प्राइसिंग, और पहले हफ्ते बिल्डर्स का अनुभव।

By Boone
XLinkedIn
claude fable 5

Claude Fable 5: लॉन्च डेटा, बेंचमार्क, और असली प्रतिक्रियाएं

Fable 5 सबसे सक्षम मॉडल है जो Anthropic ने आम जनता के लिए शिप किया है। तीसरे पक्ष के बेंचमार्क इसकी पुष्टि करते हैं। पकड़ मॉडल में नहीं है: यह उसके ऊपर लगी सुरक्षा परत में है, और एक 22 जून की सब्सक्रिप्शन डेडलाइन जिसे ज़्यादातर कवरेज ने दबा दिया।

यहां 10 जून तक की सभी पुष्टि की गई जानकारी है, नाम के साथ स्रोत सहित।

Claude Fable 5 वास्तव में क्या है

Fable 5 Anthropic का पहला Mythos-class मॉडल है जो सामान्य उपयोग के लिए उपलब्ध कराया गया है। Mythos-class Anthropic की क्षमता श्रेणी में Opus से ऊपर बैठता है, जिसे Anthropic के अपने फुटनोट में "Claude मॉडलों की एक श्रेणी जो क्षमता में हमारे Opus वर्ग से ऊपर है" के रूप में वर्णित किया गया है। Fable 5 उस श्रेणी का सार्वजनिक, नीति-कठोर संस्करण है।

Anthropic होमपेज पर Claude Fable 5 को पहले Mythos-class सार्वजनिक मॉडल के रूप में घोषित करते हुए।
Anthropic होमपेज पर Claude Fable 5 को पहले Mythos-class सार्वजनिक मॉडल के रूप में घोषित करते हुए।

anthropic.com पर घोषणा देखें

Claude Mythos 5 एक ही अंतर्निहित मॉडल है जिसमें विशिष्ट शोध क्षेत्रों में कुछ सुरक्षा उपाय हटाए गए हैं। यह Project Glasswing के माध्यम से सीमित रिलीज़ में है, साइबर सिक्योरिटी पार्टनर्स से शुरू होकर चुनिंदा बायोलॉजी रिसर्चर्स तक विस्तारित होता है। यह कोई बेंचमार्क फ्रेमवर्क या अलग आर्किटेक्चर नहीं है। यह Fable 5 है जिसमें कम गार्डरेल्स हैं।

क्षमता के अंतर के लिए Anthropic का फ्रेमिंग: "कार्य जितना लंबा और जटिल होगा, हमारे अन्य मॉडलों पर Fable 5 की बढ़त उतनी ही बड़ी होगी।" यही वह संकेत है जिसे ध्यान से पढ़ने लायक है।

Anthropic का आधिकारिक लॉन्च वीडियो, पहले 12 घंटों में 371K व्यूज।

बेंचमार्क डेटा, सत्यापित

स्वतंत्र तृतीय पक्षों ने 24 घंटों के भीतर हेडलाइन कोडिंग दावों की पुष्टि की। नीचे हर पंक्ति का एक नामित स्रोत है।

बेंचमार्कFable 5Opus 4.8तुलना
SWE-Bench Pro80.3%69.2%GPT-5.5 58.6% पर, Gemini 3.1 Pro 54.2% पर (The Decoder, Anthropic चार्ट से)
FrontierCode Diamond29.3%पिछली पीढ़ी में 13.4%FrontierCode पर #1 "मध्यम प्रयास पर भी" (Cognition)
CursorBench72.9%n/aपिछले सर्वश्रेष्ठ से 8 अंक ऊपर (Cursor)
Terminal-Bench 2.188.0%n/aGPT-5.5 से 4.6 अंक ऊपर (Cline)
AI Intelligence Index65n/a#1 रैंक, ~60 tok/s मेडियन, $8.20 ब्लेंडेड प्राइस (Artificial Analysis)
Hebbia Finance Benchmarkकिसी भी मॉडल से सर्वोच्चn/aAnthropic घोषणा
Artificial Analysis लॉन्च रिपोर्ट Claude Fable 5 को अपने Intelligence Index और GDPval-AA लीडरबोर्ड पर पहले स्थान पर रैंक करती है।
Artificial Analysis लॉन्च रिपोर्ट Claude Fable 5 को अपने Intelligence Index और GDPval-AA लीडरबोर्ड पर पहले स्थान पर रैंक करती है।

artificialanalysis.ai पर पूरी रैंकिंग पढ़ें

Stripe केस स्टडी सबसे तीखा रियल-वर्ल्ड संकेत है। 5 करोड़ लाइन के Ruby कोडबेस में, Fable 5 ने एक दिन में पूरे कोडबेस का माइग्रेशन पूरा किया जिसमें Anthropic का कहना है कि किसी ह्यूमन टीम को दो महीने से अधिक लगते।

10 जून तक अभी भी गायब है, इसलिए इन्हें अपुष्ट मानें:

  • LMArena: रजिस्टर्ड है, अभी तक कोई सार्वजनिक Elo स्कोर नहीं
  • Aider leaderboard: कोई एंट्री नहीं
  • ARC-AGI: कोई एंट्री नहीं
  • Community SWE-bench replication: अभी आ रहा है

प्राइसिंग और 22 जून की पकड़

अक्षFable 5Opus 4.8Sonnet 4.6
प्रति MTok इनपुट मूल्य$10$5$3
प्रति MTok आउटपुट मूल्य$50$25$15
Context window1M टोकन1M टोकन1M टोकन
Max output tokens128K128K64K
Thinking modeAdaptive, हमेशा चालूAdaptiveExtended + adaptive

API प्राइसिंग सीधी है, Opus 4.8 से ठीक दोगुनी। Anthropic ने नोट किया कि यह "Claude Mythos Preview से आधे से भी कम कीमत पर है," जो पहले की सीमित रिलीज़ थी।

सब्सक्रिप्शन यूजर्स के लिए, Claude Code का अपना पिकर कहता है कि Fable 5 "आपकी लिमिट Opus की तुलना में ~2x तेज़ उपयोग करता है।"

विंडो: Fable 5 को लॉन्च से 22 जून तक Pro, Max, Team, और Enterprise पर बिना अतिरिक्त शुल्क के शामिल किया गया है। 23 जून से, इन प्लान्स पर इसके लिए usage credits की आवश्यकता होगी। API एक्सेस अप्रभावित रहती है।

Simon Willison ने पहले दिन अपने pelican SVG बेंचमार्क का उपयोग करके सभी पांच effort levels का परीक्षण किया, और फैलाव instructive है:

  • Low effort: प्रति रन 9.67 सेंट
  • Max effort: प्रति रन 72.175 सेंट
  • उनका मिड-डे रनिंग टोटल: API-प्राइस्ड टोकन में $82.92, सभी अभी भी उनकी Max सब्सक्रिप्शन से कवर

यदि आप commit करने से पहले देखना चाहते हैं कि effort levels खर्च से कैसे मैप होती हैं, तो उनकी पोस्ट और effort levels का विश्लेषण सबसे तेज़ रास्ता है।

इंटरनेट वास्तव में क्या सोचता है

HN लॉन्च थ्रेड अपने पहले दिन में 2,100 अंक और 1,650 कमेंट पार कर गया। यह हाल की याद में सबसे बड़े मॉडल-लॉन्च थ्रेड्स में से एक है।

Claude Fable 5 के लिए Hacker News लॉन्च थ्रेड पहले दिन में 2100 अंक पार करता है।
Claude Fable 5 के लिए Hacker News लॉन्च थ्रेड पहले दिन में 2100 अंक पार करता है।

news.ycombinator.com पर पूरा थ्रेड पढ़ें

सबसे ज़्यादा उद्धृत आवाजें, पहुंच के क्रम में:

  • Andrej Karpathy (20,400 लाइक्स, 1.7M व्यूज): "एक मेजर-वर्जन-बंप के योग्य step change आगे।" उन्होंने जोड़ा कि आप इसे अधिक महत्वाकांक्षी कार्य दे सकते हैं और "मॉडल 'समझ जाता है' और बस चला जाता है।" उन्होंने यह भी फ्लैग किया: "लॉन्च के लिए सुरक्षा उपाय थोड़े ज़्यादा ट्रिगर हैप्पी हैं।"
  • artursapek (HN): "Fable 5 मेरे proofreading बेंचमार्क में GPT 5.5 को हराता है। और यह लगभग समान कुल लागत पर करता है।"
  • Simon Willison (HN): थ्रेड में मॉडल को "बीस्ट" कहा, यह कहते हुए कि वह ऐसी समस्याएं फेंक रहे थे जिन्हें वे "महीनों से टाल रहे थे।"
  • Reddit ("Claude Fable 5 feels less like a model launch and more like a preview of AI inequality"): 22 जून की डेडलाइन को एक कठोर एक्सेस डिवाइड के रूप में आलोचना।

आधिकारिक लॉन्च वीडियो ने लगभग पहले 12 घंटों में 371K व्यूज छुए, और टॉप क्रिएटर ब्रेकडाउन ने उसी विंडो में 73K, 66K, और 48K व्यूज खींचे।

सुरक्षा उपाय का टैक्स

क्लासिफायर्स लॉन्च की असली पकड़ हैं, और ज़्यादातर कवरेज ने उन्हें छोड़ दिया। जब कोई फायर होता है, तो API HTTP 200 एक refusal stop reason के साथ लौटाती है और चुपचाप Opus 4.8 पर फॉलबैक हो जाती है।

Simon Willison की पहले दिन की समीक्षा Fable 5 के गार्डरेल ट्रिगर और स्वचालित मॉडल फॉलबैक का वर्णन करती है।
Simon Willison की पहले दिन की समीक्षा Fable 5 के गार्डरेल ट्रिगर और स्वचालित मॉडल फॉलबैक का वर्णन करती है।

simonwillison.net पर Simon Willison के पहले इम्प्रेशन पढ़ें

उपयोगकर्ता को बताया नहीं जा सकता। Anthropic का कहना है कि यह 5% से कम सेशन्स में होता है, लेकिन पहले दिन के जो मामले सामने आए वे instructive हैं।

थ्रेड से पहले दिन के मामले:

  • matheusmoreira (HN): एक Lisp कोड रिव्यू मिड-सेशन में क्लासिफायर फ्लैग और बिना सूचना के Opus 4.8 पर स्विच से बाधित।
  • arkwin (HN): Cyber Verification Program का एक सत्यापित सदस्य जो वैध vulnerability research कर रहा था, policy violation errors हिट कर रहा था।
  • Elie Bakouch (Hugging Face, 1.79M व्यूज): Anthropic की आलोचना की कि उन्होंने जानबूझकर "frontier llm research" कार्यों में मॉडल को कमज़ोर बनाया, और उस intervention को यूजर के लिए अदृश्य रखा।

Anthropic इस बारे में खुला है कि यह जानबूझकर है। Anthropic की रिसर्च के लिए प्रोडक्ट मैनेजमेंट की प्रमुख Dianne Penn ने CNBC को बताया कि टीम "इस लॉन्च के लिए नए प्रकार के क्लासिफायर और नए प्रकार के सेफ्टी गार्डरेल्स बनाने के बारे में बहुत जानबूझकर रहना चाहती थी।"

लॉन्च के बाद क्लासिफायर स्कोप सख्त हो सकता है। नीति एक बग फिक्स नहीं बनेगी, क्योंकि यह कोई बग नहीं है।

एक अलग ब्लॉकर: Fable 5 एक Covered Model है जिसमें 30-दिन का data retention requirement है। कोई zero-data-retention विकल्प नहीं है। Zed और GitHub Copilot for Business के यूजर्स ने ZDR-required शॉप्स के लिए इसे तुरंत एक कठोर adoption blocker के रूप में फ्लैग किया।

डिज़ाइनर्स को Fable 5 के साथ क्या करना चाहिए

Anthropic Fable 5 के लिए vision और long-horizon agentic work को हेडलाइन सुधार के रूप में नामित करता है। डिज़ाइनर्स के लिए इसका मतलब है पूरे design-system refactors, multi-file Figma-to-code runs, और agentic sessions जो पहले एक घंटे के बाद टूट जाते थे, बिल्कुल वही वर्कफ्लो जो डिज़ाइन वर्क के लिए Claude Code और agentic design workflows में कवर किए गए हैं।

Karpathy का व्यावहारिक रीफ्रेम सबसे उपयोगी takeaway है। प्रॉम्प्ट नहीं, ब्रीफ को बड़ा करें।

Fable 5 one-liners में बेहतर नहीं है। यह एक बड़े, जटिल कार्य को context में रखने और वास्तव में पूरा करने में बेहतर है। यदि आप components एक-एक करके भेज रहे थे क्योंकि आप मॉडल पर पूरे सिस्टम को रखने का भरोसा नहीं करते थे, अब पूरे सिस्टम को test करने का समय है।

22 जून से पहले इन्हें test करें, उस क्रम में जो सबसे अधिक reveal करेगा:

  • एक single session में पूरी component library migration
  • structured output के साथ multi-file design token audit
  • 10 या अधिक components वाले layout पर Figma-description-to-code run
  • कोई भी long agentic workflow जो पहले context fill पर रुक जाती थी

Opus 4.8 ने क्या बदला उसकी तुलना में, Fable 5 उन्हीं patterns को लंबे sessions और बड़े scopes में extend करता है। छत आगे बढ़ी है। तरीका वही है।

डिज़ाइनर के वर्कस्टेशन का voxel illustration, dark bronze studio lighting और cyan accent के साथ।
डिज़ाइनर के वर्कस्टेशन का voxel illustration, dark bronze studio lighting और cyan accent के साथ।

FAQ

Claude Fable 5 और Claude Mythos 5 में क्या अंतर है?

एक ही अंतर्निहित मॉडल। Fable 5 में सामान्य उपयोग के लिए safety classifiers सक्रिय हैं। Mythos 5 में Project Glasswing के माध्यम से, साइबर सिक्योरिटी पार्टनर्स से शुरू होकर, सत्यापित रिसर्च पार्टनर्स के लिए कुछ classifiers हटाए गए हैं। Mythos 5 सार्वजनिक रूप से उपलब्ध नहीं है।

Claude Fable 5 कब लॉन्च हुआ?

9 जून, 2026। घोषणा anthropic.com/news/claude-fable-5-mythos-5 पर है।

API के लिए model ID क्या है?

Claude API और Vertex AI पर claude-fable-5। Amazon Bedrock पर anthropic.claude-fable-5

Context window क्या है?

डिफ़ॉल्ट रूप से 1 मिलियन टोकन, प्रति request 128K output tokens तक। यह Opus 4.8 जितना ही context है और Sonnet के maximum output का दोगुना।

क्या Fable 5 अभी मेरी Claude सब्सक्रिप्शन पर है?

हां, Pro, Max, Team, और Enterprise पर 22 जून तक बिना अतिरिक्त लागत के। 23 जून से इन प्लान्स पर usage credits की आवश्यकता होगी। API प्राइसिंग प्रभावित नहीं है।

जब classifier fire होता है तो क्या होता है?

API stop_reason "refusal" के साथ HTTP 200 लौटाती है और Opus 4.8 पर स्विच हो जाती है। Anthropic का कहना है कि यह 5% से कम sessions में होता है। फॉलबैक हमेशा यूजर को दिखाई नहीं देता।

क्या Fable 5 zero-data-retention को support करता है?

नहीं। यह 30-दिन के data retention requirement वाला Covered Model है। ZDR requirements वाले enterprise environments के लिए यह एक कठोर ब्लॉकर है।

Fable 5 का knowledge cutoff क्या है?

Anthropic ने 10 जून तक Fable 5 के लिए कोई knowledge cutoff प्रकाशित नहीं किया है।

मॉडल नियमों से पहले तैयार है

बेंचमार्क असली हैं, कोडिंग परफॉर्मेंस की कई स्वतंत्र स्रोतों द्वारा पुष्टि की गई है, और Stripe केस स्टडी इस बात का सबसे ठोस संकेत है कि production में long-horizon क्षमता का वास्तव में क्या अर्थ है। यह सबसे अच्छा मॉडल है जो Anthropic ने आम जनता के लिए शिप किया है।

अंतरालों पर ईमानदार पढ़ाई: classifier behavior एक जानबूझकर की गई नीतिगत पसंद है जिसके बारे में Anthropic पारदर्शी है, ZDR ब्लॉकर structural है, और 22 जून की विंडो एक वास्तविक deadline है। इनमें से कोई भी क्षमता को रद्द नहीं करता। यह सब तय करता है कि आप इसे कब और कैसे वास्तव में उपयोग कर सकते हैं।

इसे अभी test करें, उन वर्कफ्लो पर जो मायने रखती हैं, सब्सक्रिप्शन विंडो बंद होने से पहले। क्षमता वहां है। नीति परत अभी भी calibrate हो रही है।

Brainy creators get briefs, tools, and an audience of 2M+ designers. If you are already building with models like Fable 5, come build with us.

Get Started

More from Brainy Papers

Keep reading