ai for designersJune 10, 20268 min read

Claude Fable 5: داده‌های انتشار، معیارها و واکنش‌های واقعی

Claude Fable 5 در ۹ ژوئن به عنوان اولین مدل Mythos-class شرکت Anthropic منتشر شد. معیارهای تأییدشده، قیمت‌گذاری واقعی، و آنچه سازندگان در هفته اول با آن روبرو شدند.

By Boone
XLinkedIn
claude fable 5

Claude Fable 5: داده‌های انتشار، معیارها و واکنش‌های واقعی

Fable 5 قابل‌ترین مدلی است که Anthropic تاکنون برای عموم عرضه کرده. معیارهای مستقل شخص ثالث این ادعا را تأیید می‌کنند. نکته اصلی خود مدل نیست: لایه محافظ روی آن است، و یک ضرب‌الاجل ۲۲ ژوئن که اکثر پوشش‌های خبری آن را مدفون کردند.

اینجا همه چیزی است که تا ۱۰ ژوئن، یک روز پس از انتشار، با ذکر منبع تأیید شده است.

Claude Fable 5 واقعاً چیست

Fable 5 اولین مدل Mythos-class شرکت Anthropic است که برای استفاده عمومی در دسترس قرار گرفته. Mythos-class در سلسله‌مراتب قابلیتی Anthropic بالاتر از Opus قرار دارد، با پانویس خود Anthropic که آن را «رده‌ای از مدل‌های Claude که از نظر قابلیت بالاتر از کلاس Opus ما قرار دارند» توصیف می‌کند. Fable 5 نسخه عمومی و سیاست‌سخت‌شده‌ی این رده است.

صفحه اصلی Anthropic که Claude Fable 5 را به عنوان اولین مدل عمومی Mythos-class معرفی می‌کند.
صفحه اصلی Anthropic که Claude Fable 5 را به عنوان اولین مدل عمومی Mythos-class معرفی می‌کند.

اطلاعیه را در anthropic.com ببینید

Claude Mythos 5 همان مدل پایه است با برخی محافظت‌های برداشته‌شده در حوزه‌های تحقیقاتی خاص. این مدل از طریق Project Glasswing در انتشار محدود است، ابتدا با شرکای امنیت سایبری و سپس با گسترش به محققان زیست‌شناسی منتخب. نه یک چارچوب معیار است، نه یک معماری جداگانه. Fable 5 است با موانع کمتر.

چارچوب‌بندی Anthropic برای شکاف قابلیتی: «هرچه وظیفه طولانی‌تر و پیچیده‌تر باشد، برتری Fable 5 نسبت به سایر مدل‌های ما بیشتر است.» این آن سیگنالی است که ارزش خواندن دقیق دارد.

ویدیوی رسمی انتشار Anthropic، ۳۷۱ هزار بازدید در ۱۲ ساعت اول.

داده‌های معیار، تأییدشده

اشخاص ثالث مستقل ادعاهای اصلی کدنویسی را در ۲۴ ساعت تأیید کردند. هر ردیف زیر منبعی با نام دارد.

معیارFable 5Opus 4.8مقایسه
SWE-Bench Pro۸۰.۳٪۶۹.۲٪GPT-5.5 در ۵۸.۶٪، Gemini 3.1 Pro در ۵۴.۲٪ (The Decoder، از نمودارهای Anthropic)
FrontierCode Diamond۲۹.۳٪۱۳.۴٪ نسل قبلیرتبه ۱ در FrontierCode «حتی با تلاش متوسط» (Cognition)
CursorBench۷۲.۹٪n/a۸ امتیاز بالاتر از بهترین قبلی (Cursor)
Terminal-Bench 2.1۸۸.۰٪n/a۴.۶ امتیاز بالاتر از GPT-5.5 (Cline)
AI Intelligence Index۶۵n/aرتبه ۱، میانه ~۶۰ tok/s، قیمت ترکیبی ۸.۲۰ دلار (Artificial Analysis)
Hebbia Finance Benchmarkبالاترین در میان همه مدل‌هاn/aاطلاعیه Anthropic
گزارش انتشار Artificial Analysis که Claude Fable 5 را در Intelligence Index و جدول رتبه‌بندی GDPval-AA در رتبه اول قرار می‌دهد.
گزارش انتشار Artificial Analysis که Claude Fable 5 را در Intelligence Index و جدول رتبه‌بندی GDPval-AA در رتبه اول قرار می‌دهد.

رتبه‌بندی کامل را در artificialanalysis.ai بخوانید

مطالعه موردی Stripe تیزترین سیگنال دنیای واقعی است. در یک پایگاه کد Ruby با ۵۰ میلیون خط، Fable 5 یک مهاجرت سراسری پایگاه کد را در یک روز کامل کرد که Anthropic می‌گوید برای یک تیم انسانی بیش از دو ماه طول می‌کشید.

تا ۱۰ ژوئن هنوز موجود نیست، پس این‌ها را تأییدنشده در نظر بگیرید:

  • LMArena: ثبت‌شده، هنوز امتیاز Elo عمومی ندارد
  • جدول رتبه‌بندی Aider: بدون ورودی
  • ARC-AGI: بدون ورودی
  • تکرار SWE-bench توسط جامعه: هنوز در راه

قیمت‌گذاری و نکته ۲۲ ژوئن

محورFable 5Opus 4.8Sonnet 4.6
قیمت ورودی به ازای هر MTok۱۰ دلار۵ دلار۳ دلار
قیمت خروجی به ازای هر MTok۵۰ دلار۲۵ دلار۱۵ دلار
پنجره زمینه۱ میلیون توکن۱ میلیون توکن۱ میلیون توکن
حداکثر توکن‌های خروجی۱۲۸ هزار۱۲۸ هزار۶۴ هزار
حالت تفکرتطبیقی، همیشه روشنتطبیقیتوسعه‌یافته و تطبیقی

قیمت‌گذاری API ساده است، دقیقاً دو برابر Opus 4.8. Anthropic اشاره می‌کند که «کمتر از نصف قیمت Claude Mythos Preview»، انتشار محدود قبلی، است.

برای کاربران اشتراک، انتخابگر خود Claude Code می‌گوید Fable 5 «محدودیت‌های شما را ~۲ برابر سریع‌تر از Opus مصرف می‌کند.»

پنجره زمانی: Fable 5 از زمان انتشار تا ۲۲ ژوئن در پلان‌های Pro، Max، Team و Enterprise بدون هزینه اضافی گنجانده شده. از ۲۳ ژوئن، در این پلان‌ها نیاز به اعتبار مصرفی دارد. دسترسی API تحت تأثیر قرار نمی‌گیرد.

Simon Willison تمام پنج سطح تلاش را در روز اول با معیار SVG پلیکان خود آزمایش کرد و گستره آن آموزنده است:

  • تلاش کم: ۹.۶۷ سنت در هر اجرا
  • حداکثر تلاش: ۷۲.۱۷۵ سنت در هر اجرا
  • جمع میانه‌روز او: ۸۲.۹۲ دلار در توکن‌های قیمت‌گذاری‌شده API، همه هنوز تحت پوشش اشتراک Max او

اگر می‌خواهید ببینید چگونه سطوح تلاش به هزینه نگاشت می‌شوند قبل از تعهد، پست او و تفکیک سطوح تلاش سریع‌ترین مسیر هستند.

اینترنت واقعاً چه فکری می‌کند

رشته راه‌اندازی HN از ۲۱۰۰ امتیاز و ۱۶۵۰ نظر در اولین روز گذشت. این یکی از بزرگ‌ترین رشته‌های راه‌اندازی مدل در حافظه اخیر است.

رشته راه‌اندازی Hacker News برای Claude Fable 5 که در روز اول از ۲۱۰۰ امتیاز گذشت.
رشته راه‌اندازی Hacker News برای Claude Fable 5 که در روز اول از ۲۱۰۰ امتیاز گذشت.

رشته کامل را در news.ycombinator.com بخوانید

صداهای بیشترین استناد، به ترتیب دسترسی:

  • Andrej Karpathy (۲۰۴۰۰ لایک، ۱.۷ میلیون بازدید): «یک گام به جلو که ارزش یک نسخه اصلی را دارد.» او اضافه کرد که می‌توانید وظایف بلندپروازانه‌تری به آن بدهید و «مدل آن را 'می‌فهمد' و فقط پیش می‌رود.» او همچنین اشاره کرد: «محافظت‌ها برای انتشار کمی بیش از حد حساس تنظیم شده‌اند.»
  • artursapek (HN): «Fable 5 در معیار غلط‌گیری من از GPT 5.5 بهتر است. و با تقریباً همان هزینه کل این کار را می‌کند.»
  • Simon Willison (HN): مدل را «یک هیولا» در رشته خواند و گفت مشکلاتی را به آن می‌دهد که «ماه‌ها از آن‌ها طفره رفته بودم.»
  • Reddit («Claude Fable 5 بیشتر شبیه پیش‌نمایش نابرابری هوش مصنوعی است تا راه‌اندازی مدل»): انتقادی سازمان‌یافته پیرامون ضرب‌الاجل ۲۲ ژوئن به عنوان یک شکاف دسترسی سخت.

ویدیوی رسمی راه‌اندازی در تقریباً ۱۲ ساعت اول به ۳۷۱ هزار بازدید رسید، با برترین تحلیل‌های سازندگان محتوا که در همان بازه ۷۳ هزار، ۶۶ هزار و ۴۸ هزار بازدید داشتند.

مالیات محافظت‌ها

طبقه‌بندها واقعی‌ترین گرفتاری انتشار هستند و اکثر پوشش‌های خبری از آن‌ها گذشتند. وقتی یکی فعال می‌شود، API پاسخ HTTP 200 با دلیل توقف refusal برمی‌گرداند و بی‌صدا به Opus 4.8 برمی‌گردد.

بررسی روز اول Simon Willison که تریگرهای حفاظتی Fable 5 و بازگشت خودکار به مدل دیگر را توصیف می‌کند.
بررسی روز اول Simon Willison که تریگرهای حفاظتی Fable 5 و بازگشت خودکار به مدل دیگر را توصیف می‌کند.

اولین برداشت‌های Simon Willison را در simonwillison.net بخوانید

ممکن است کاربر مطلع نشود. Anthropic می‌گوید این در کمتر از ۵٪ از نشست‌ها اتفاق می‌افتد، اما موارد روز اول که ظهور کردند آموزنده‌اند.

موارد روز اول از رشته:

  • matheusmoreira (HN): یک بررسی کد Lisp که در وسط نشست توسط یک پرچم طبقه‌بند قطع شد و بدون اطلاع قبلی به Opus 4.8 تغییر یافت.
  • arkwin (HN): یک عضو تأییدشده Cyber Verification Program که تحقیق آسیب‌پذیری مشروع انجام می‌داد و با خطاهای نقض سیاست مواجه شد.
  • Elie Bakouch (Hugging Face، ۱.۷۹ میلیون بازدید): از Anthropic به خاطر عمداً بدتر کردن مدل برای وظایف «تحقیق llm مرزی» و مخفی نگه داشتن این مداخله از کاربر انتقاد کرد.

Anthropic صریح است که این عمدی است. Dianne Penn، رئیس مدیریت محصول تحقیقاتی Anthropic، به CNBC گفت تیم می‌خواست «در ساخت انواع جدید طبقه‌بندها و انواع جدید حفاظت‌های ایمنی برای این انتشار بسیار سنجیده عمل کند.»

دامنه طبقه‌بند ممکن است پس از انتشار محدودتر شود. سیاست تبدیل به یک رفع اشکال نخواهد شد، چون یک اشکال نیست.

یک مانع جداگانه: Fable 5 یک Covered Model با الزام نگهداری داده ۳۰ روزه است. گزینه zero-data-retention وجود ندارد. کاربران Zed و GitHub Copilot for Business این را بلافاصله به عنوان یک مانع سخت پذیرش برای فروشگاه‌های نیازمند ZDR اعلام کردند.

طراحان با Fable 5 چه باید بکنند

Anthropic بینایی و کار عاملی با افق بلند را به عنوان بهبودهای اصلی Fable 5 نام می‌برد. برای طراحان این به معنای بازسازی کامل سیستم طراحی، اجرای چندفایله Figma-به-کد، و نشست‌های عاملی است که قبلاً پس از یک ساعت از هم می‌پاشیدند، دقیقاً همان گردش‌های کاری که در Claude Code برای کار طراحی و گردش‌های کاری طراحی عاملی پوشش داده شده‌اند.

عملی‌ترین بازتعریف Karpathy مفیدترین نکته است. دامنه بریف را گسترش دهید، نه پرامپت را.

Fable 5 در تک‌خطی‌ها بهتر نیست. در نگه داشتن یک وظیفه بزرگ و پیچیده در زمینه و واقعاً تکمیل آن بهتر است. اگر تا الان کامپوننت‌ها را یکی یکی ارسال می‌کردید چون به مدل برای نگه داشتن کل سیستم اعتماد نداشتید، حالا وقت آزمایش کل سیستم است.

اینها را قبل از ۲۲ ژوئن آزمایش کنید، به ترتیب آنچه بیشترین نتیجه را نشان خواهد داد:

  • مهاجرت کامل کتابخانه کامپوننت در یک نشست واحد
  • بررسی توکن طراحی چندفایله با خروجی ساختاریافته
  • اجرای توصیف-Figma-به-کد روی یک طرح‌بندی با ۱۰ یا بیشتر کامپوننت
  • هر گردش کار عاملی طولانی که قبلاً هنگام پر شدن زمینه متوقف شد

در مقایسه با آنچه Opus 4.8 تغییر داد، Fable 5 همان الگوها را به نشست‌های طولانی‌تر و دامنه‌های بزرگ‌تر گسترش می‌دهد. سقف جابجا شده. رویکرد یکسان است.

تصویر voxel از ایستگاه کاری طراح با نور تاریک برنزی استودیو و رنگ مکمل فیروزه‌ای.
تصویر voxel از ایستگاه کاری طراح با نور تاریک برنزی استودیو و رنگ مکمل فیروزه‌ای.

سوالات متداول

تفاوت بین Claude Fable 5 و Claude Mythos 5 چیست؟

همان مدل پایه. Fable 5 طبقه‌بندهای ایمنی برای استفاده عمومی فعال دارد. Mythos 5 برخی از آن طبقه‌بندها را برای شرکای تحقیقاتی تأییدشده از طریق Project Glasswing، ابتدا با شرکای امنیت سایبری، برداشته است. Mythos 5 به صورت عمومی در دسترس نیست.

Claude Fable 5 کی منتشر شد؟

۹ ژوئن ۲۰۲۶. اطلاعیه در anthropic.com/news/claude-fable-5-mythos-5 است.

شناسه مدل برای API چیست؟

claude-fable-5 در Claude API و Vertex AI. anthropic.claude-fable-5 در Amazon Bedrock.

پنجره زمینه چقدر است؟

به طور پیش‌فرض ۱ میلیون توکن، با تا ۱۲۸ هزار توکن خروجی در هر درخواست. این همان زمینه Opus 4.8 است و دو برابر حداکثر خروجی Sonnet.

آیا Fable 5 الان در اشتراک Claude من است؟

بله، تا ۲۲ ژوئن بدون هزینه اضافی در پلان‌های Pro، Max، Team و Enterprise. از ۲۳ ژوئن در این پلان‌ها نیاز به اعتبار مصرفی دارد. قیمت‌گذاری API تحت تأثیر قرار نمی‌گیرد.

وقتی طبقه‌بند فعال می‌شود چه اتفاقی می‌افتد؟

API پاسخ HTTP 200 با stop_reason "refusal" برمی‌گرداند و به Opus 4.8 تغییر می‌دهد. Anthropic می‌گوید در کمتر از ۵٪ از نشست‌ها اتفاق می‌افتد. این بازگشت همیشه برای کاربر قابل مشاهده نیست.

آیا Fable 5 از zero-data-retention پشتیبانی می‌کند؟

نه. یک Covered Model با الزام نگهداری داده ۳۰ روزه است. این یک مانع سخت برای محیط‌های سازمانی با الزامات ZDR است.

قطع دانش Fable 5 چه زمانی است؟

تا ۱۰ ژوئن، Anthropic تاریخ قطع دانش Fable 5 را منتشر نکرده است.

مدل آماده است قبل از اینکه قوانین آماده باشند

معیارها واقعی هستند، عملکرد کدنویسی توسط چندین منبع مستقل تأیید شده، و مطالعه موردی Stripe مشخص‌ترین سیگنال از معنای واقعی قابلیت افق‌بلند در محیط تولید است. این بهترین مدلی است که Anthropic برای عموم عرضه کرده.

خوانش صادقانه از شکاف‌ها: رفتار طبقه‌بند یک انتخاب سیاستی عمدی است که Anthropic درباره‌اش شفاف است، مانع ZDR ساختاری است، و پنجره ۲۲ ژوئن یک ضرب‌الاجل واقعی است. هیچ‌کدام از اینها قابلیت را لغو نمی‌کند. همه‌شان شکل می‌دهند که کِی و چگونه می‌توانید واقعاً از آن استفاده کنید.

الان آن را آزمایش کنید، روی گردش‌های کاری که اهمیت دارند، قبل از اینکه پنجره اشتراک بسته شود. قابلیت آنجاست. لایه سیاست هنوز در حال کالیبراسیون است.

Brainy creators get briefs, tools, and an audience of 2M+ designers. If you are already building with models like Fable 5, come build with us.

Get Started

More from Brainy Papers

Keep reading