ai for designersJune 10, 20268 min read

Claude Fable 5: ローンチデータ、ベンチマーク、リアルな反応

Claude Fable 5は6月9日にAnthropicの初のMythos-classモデルとしてローンチした。検証済みベンチマーク、実際の価格、そして開発者が最初の1週間で直面したこと。

By Boone
XLinkedIn
claude fable 5

Claude Fable 5: ローンチデータ、ベンチマーク、リアルな反応

Fable 5はAnthropicが一般公開した中で最も高性能なモデルだ。サードパーティのベンチマークがそれを裏付けている。問題はモデル自体ではない。その上に積み重なるセーフガード層と、多くのメディアが見過ごした6月22日のサブスクリプション期限だ。

6月10日、ローンチ翌日時点で確認されたすべてを、出典名付きでまとめる。

Claude Fable 5とは何か

Fable 5はAnthropicが一般向けに公開した初のMythos-classモデルだ。Mythos-classはAnthropicの能力階層においてOpusの上位に位置し、Anthropic自身の注釈では「Opusクラスより能力的に上位に位置するClaudeモデルの階層」と説明されている。Fable 5はその階層のパブリック版、ポリシー強化済みバージョンだ。

Claude Fable 5を初のMythos-classパブリックモデルとして発表するAnthropicホームページ。
Claude Fable 5を初のMythos-classパブリックモデルとして発表するAnthropicホームページ。

anthropic.comでアナウンスを見る

Claude Mythos 5は同じ基盤モデルから特定の研究領域でいくつかのセーフガードを解除したものだ。Project Glasswingを通じた限定リリースで、サイバーセキュリティパートナーから始まり、特定の生物学研究者へと拡大している。ベンチマークフレームワークでも別アーキテクチャでもない。ガードレールを減らしたFable 5だ。

Anthropicの能力差についての説明: 「タスクが長く複雑であるほど、他のモデルに対するFable 5のリードは大きくなる。」これは注意深く読む価値のあるシグナルだ。

Anthropic's official launch video, 371K views in its first 12 hours.

検証済みベンチマークデータ

独立したサードパーティが24時間以内にコーディングの主要クレームを確認した。以下の各行には出典名がある。

ベンチマークFable 5Opus 4.8比較
SWE-Bench Pro80.3%69.2%GPT-5.5が58.6%、Gemini 3.1 Proが54.2% (The Decoder、Anthropicチャートより)
FrontierCode Diamond29.3%前世代13.4%「中程度の努力でも」FrontierCode第1位 (Cognition)
CursorBench72.9%n/a前回最高スコアより8ポイント上 (Cursor)
Terminal-Bench 2.188.0%n/aGPT-5.5より4.6ポイント上 (Cline)
AI Intelligence Index65n/a第1位、中央値約60 tok/s、ブレンド価格$8.20 (Artificial Analysis)
Hebbia Finance Benchmarkすべてのモデル中最高n/aAnthropicアナウンス
Claude Fable 5をIntelligence IndexとGDPval-AAリーダーボードで第1位にランクしたArtificial Analysisのローンチレポート。
Claude Fable 5をIntelligence IndexとGDPval-AAリーダーボードで第1位にランクしたArtificial Analysisのローンチレポート。

artificialanalysis.aiで完全なランキングを読む

最も鮮明なリアルワールドシグナルはStripeのケーススタディだ。5000万行のRubyコードベースで、Fable 5は人間チームなら2ヶ月以上かかるとAnthropicが言うコードベース全体の移行を1日で完了させた。

6月10日時点でまだ未確認のため、これらは未確認として扱うこと:

  • LMArena: 登録済み、公開Eloスコアはまだなし
  • Aiderリーダーボード: エントリーなし
  • ARC-AGI: エントリーなし
  • コミュニティSWE-benchレプリケーション: まだ入ってきていない

価格と6月22日の注意点

項目Fable 5Opus 4.8Sonnet 4.6
入力価格 (MTokあたり)$10$5$3
出力価格 (MTokあたり)$50$25$15
コンテキストウィンドウ1Mトークン1Mトークン1Mトークン
最大出力トークン128K128K64K
Thinkingモードアダプティブ、常時オンアダプティブ拡張 + アダプティブ

API価格はシンプルで、Opus 4.8のちょうど2倍だ。Anthropicは「Claude Mythos Previewの半額以下」と述べている。Mythos Previewは以前の限定リリースだ。

サブスクリプションユーザー向けには、Claude Code自身のピッカーがFable 5について「Opusより約2倍速く制限を消費する」と説明している。

期間: Fable 5はPro、Max、Team、Enterpriseでローンチから6月22日まで追加料金なしで含まれる。6月23日からはそれらのプランでは使用クレジットが必要になる。APIアクセスは影響を受けない。

Simon Willisonは初日にペリカンのSVGベンチマークを使い、5つの努力レベルすべてをテストした。そのばらつきは参考になる:

  • 低努力: 1回9.67セント
  • 最大努力: 1回72.175セント
  • 彼の昼時点の合計: APIプライス換算で$82.92のトークン使用、すべてMaxサブスクリプションでカバー済み

コミットする前に努力レベルが支出にどうマッピングされるかを確認したければ、彼の投稿と努力レベルの解説が最速の道だ。

インターネットが実際に思っていること

HNのローンチスレッドは最初の1日で2100ポイントと1650コメントを超えた。最近のモデルローンチスレッドの中でも最大級だ。

Claude Fable 5のHacker Newsローンチスレッドが最初の1日で2100ポイントを超えた様子。
Claude Fable 5のHacker Newsローンチスレッドが最初の1日で2100ポイントを超えた様子。

news.ycombinator.comで完全なスレッドを読む

リーチ順で最も引用された声:

  • Andrej Karpathy (いいね2万400件、170万ビュー): 「メジャーバージョンアップに値する大きな前進。」より野心的なタスクを与えると「モデルが'理解して'そのままやり遂げる」と付け加えた。また「ローンチ時のセーフガードが少し過剰反応するよう設定されている」とも指摘した。
  • artursapek (HN): 「Fable 5は私の校正ベンチマークでGPT 5.5を上回る。しかもほぼ同じ総コストで。」
  • Simon Willison (HN): スレッドでモデルを「beast(化け物)」と呼び、「何ヶ月も先延ばしにしていた問題を投げつけていた」と述べた。
  • Reddit (「Claude Fable 5はモデルローンチというよりAI格差の予告のように感じる」): 6月22日の期限をアクセスの明確な分断線として批判する意見が集まった。

公式ローンチ動画は最初の約12時間で37万1千回再生され、上位のクリエイターによる解説動画が同じ期間に7万3千回、6万6千回、4万8千回のビューを集めた。

セーフガードの代償

分類器はこのローンチの真の問題点で、多くの報道がそれをスキップした。分類器が作動すると、APIはHTTP 200を返し、refusalのstop reasonとともに静かにOpus 4.8にフォールバックする。

Simon Willisonの初日レビュー、Fable 5のガードレールトリガーと自動モデルフォールバックについて説明している。
Simon Willisonの初日レビュー、Fable 5のガードレールトリガーと自動モデルフォールバックについて説明している。

simonwillison.netでSimon Willisonの第一印象を読む

ユーザーに通知されない場合がある。Anthropicはこれがセッションの5%未満で発生すると言うが、初日に浮上したケースは参考になる。

スレッドからの初日ケース:

  • matheusmoreira (HN): セッション中盤にLispコードレビューが分類器フラグによって中断され、告知なしにOpus 4.8に切り替わった。
  • arkwin (HN): 正当な脆弱性調査を行っているCyber Verification Programの審査済みメンバーがポリシー違反エラーに直面した。
  • Elie Bakouch (Hugging Face、179万ビュー): モデルを「フロンティアLLM研究」タスクで意図的に劣化させ、その介入をユーザーから見えないようにしているとAnthropicを批判した。

Anthropicはこれが意図的なものであることを公言している。AnthropicのプロダクトマネジメントヘッドであるDianne PennはCNBCに、チームはこのローンチに向けて「新しいタイプの分類器と新しいタイプの安全ガードレールを構築することに非常に意図的に取り組みたかった」と語った。

分類器のスコープはローンチ後に絞られる可能性がある。ポリシーはバグフィックスにはならない。バグではないからだ。

別の採用ブロッカー: Fable 5はCovered Modelであり、30日間のデータ保持要件がある。ゼロデータリテンションオプションは存在しない。ZedとGitHub Copilot for Businessのユーザーは即座にこれをZDR必須環境での採用の完全な障壁として指摘した。

デザイナーがFable 5でやるべきこと

AnthropicはビジョンとロングホライズンのエージェンティックワークをFable 5の主要な改善点として挙げている。デザイナーにとってそれは、フルデザインシステムのリファクタリング、マルチファイルのFigma-to-codeラン、そして以前は1時間後に崩壊していたエージェンティックセッションを意味する。これらはまさにClaude Codeとデザイン作業エージェンティックデザインワークフローでカバーされているワークフローだ。

Karpathyの実践的な再フレーミングが最も役に立つ示唆だ。プロンプトではなく、ブリーフのスコープを広げること。

Fable 5は短いタスクが特段得意なわけではない。大きく複雑なタスクをコンテキストに保持して実際に完了させることが得意だ。モデルがシステム全体を保持できないと信頼できなかったため、コンポーネントを一つずつ送っていたなら、今こそシステム全体をテストする時だ。

6月22日前に、最も多くを明らかにする順でこれらをテストすること:

  • 単一セッションでの完全なコンポーネントライブラリ移行
  • 構造化出力を伴うマルチファイルのデザイントークン監査
  • 10個以上のコンポーネントを持つレイアウトへのFigmaディスクリプション-to-codeラン
  • 以前コンテキスト充填で止まっていた長いエージェンティックワークフロー

Opus 4.8が変えたことと比べると、Fable 5はそれと同じパターンをより長いセッションとより大きなスコープへと拡張している。上限が上がった。アプローチは同じだ。

ダークブロンズのスタジオライティングにシアンアクセントを施したデザイナーのワークステーションのボクセルイラスト。
ダークブロンズのスタジオライティングにシアンアクセントを施したデザイナーのワークステーションのボクセルイラスト。

FAQ

Claude Fable 5とClaude Mythos 5の違いは何か

同じ基盤モデルだ。Fable 5は一般使用向けに安全分類器がアクティブになっている。Mythos 5はProject Glasswingを通じて審査済みの研究パートナー向けにそれらの分類器の一部を解除したもので、サイバーセキュリティパートナーから始まっている。Mythos 5は一般公開されていない。

Claude Fable 5はいつローンチしたか

2026年6月9日。アナウンスはanthropic.com/news/claude-fable-5-mythos-5にある。

APIのモデルIDは何か

Claude APIとVertex AIではclaude-fable-5。Amazon Bedrockではanthropic.claude-fable-5

コンテキストウィンドウはどれくらいか

デフォルトで100万トークン、リクエストあたり最大128Kの出力トークン。Opus 4.8と同じコンテキストで、Sonnetの最大出力の2倍だ。

今、Fable 5はClaudeサブスクリプションに含まれているか

はい、6月22日まではPro、Max、Team、Enterpriseで追加コストなしで使える。6月23日からはそれらのプランでは使用クレジットが必要になる。API価格は影響を受けない。

分類器が作動するとどうなるか

APIはHTTP 200をstop_reason "refusal"とともに返し、Opus 4.8に切り替わる。Anthropicによれば5%未満のセッションで発生する。フォールバックはユーザーに常に表示されるわけではない。

Fable 5はゼロデータリテンションをサポートしているか

いいえ。30日間のデータ保持要件があるCovered Modelだ。ZDR要件がある企業環境では採用の完全な障壁となる。

Fable 5の知識カットオフはいつか

6月10日時点でAnthropicはFable 5のカットオフを公表していない。

モデルはルールより先に準備ができている

ベンチマークは本物で、コーディングパフォーマンスは複数の独立したソースによって確認されており、Stripeのケーススタディは長期的な能力が本番環境で実際に何を意味するかを示す最も具体的なシグナルだ。これはAnthropicが一般公開した中で最高のモデルだ。

ギャップについての正直な読み: 分類器の動作はAnthropicが透明に認める意図的なポリシー選択であり、ZDRブロッカーは構造的であり、6月22日の期間は実際の期限だ。それらはどれも能力を否定しない。すべてが、実際にいつどのように使えるかを形作る。

今すぐテストすること、重要なワークフローで、サブスクリプション期間が閉じる前に。能力はある。ポリシー層はまだ調整中だ。

Brainy creators get briefs, tools, and an audience of 2M+ designers. If you are already building with models like Fable 5, come build with us.

Get Started

More from Brainy Papers

Keep reading