50% off 全プラン対象、期間限定。月額 $2.48/mo
残り7分
AIと機械学習

Claude Code の Fable 5:実際に何が変わったのか(初日の所感)

R By Riley 読了7分
Claude Code内にFable 5開発者ダッシュボードを表示した、3ターンのワークフロー完了・テスト検証・自己検証メモ付きの広いダークモードブログバナー(オレンジのアクセント入り)。

初日に Claude Code のデフォルトを Fable 5 に設定し、通常は午後いっぱいかかるマルチファイルタスクを渡しました。コーヒーを入れに行きました。戻って座ったときには完了しており、依頼もしていなかった2つの関連する問題まで静かに修正していました。

これは本物の仕事における本物の切り替えであり、ベンチマーク結果の読み上げではありません。そしてOpus 4.8に払っていた額の2倍のコストがかかるので、それだけの価値があるかは修辞的な問いではなく、純粋な疑問です。私の作業方法で本当に3つのことが変わりました。1つのことは正直なところ不満です。すべてをまとめ、さらに1時間以内に自分で試せることも紹介します。

簡潔なまとめ

3つの実質的な変化:Fable 5が返却前に自分の作業を検証するため、複雑なマルチファイルリファクタリングが少ないターンで完了する;サブエージェントへの委任は監視なしで動作する;そしてビジョンタスクはスクリーンショットを読み取り、はるかに少ない手助けでロジックを再構築する。唯一の残念な点:セーフガードが時々作動し、Opus 4.8にルーティングされる。これは返答で分かるのであって、送信前ではない。Fable 5を期待していたのにOpusの回答が返ってくる。結論:難しく長期的な作業には価値がある。料金にコミットする前に実際のタスクでテストすること——単純な作業では2倍のコストがただの2倍になるだけだ。

ターン数が少ない、自分の作業を検証するから

私が話したあのリファクタリング:1週間前に Opus 4.8 で実行したバージョンは8〜9回のやり取りを要し、そのうち2回は私が返ってきた壊れたビルドを自分で修正しました。Fable 5 は3回で完了し、私が見つけるのを待つ代わりにすでにバグを探しに行っていました。理由は、Fable 5 がより多くのコンテキストを保持し、引き渡し前に自己検証するからです。Simon Willison は同じことをより強く経験しました:in リリース初日の所感 1つだけ修正するよう依頼されたタスクで、モデルが複数の根本的なライブラリ問題を見つけて修正する様子を彼は説明しています。

だからここでの違いは速度ではない。Fable 5 は結果を返す前に自分の作業を確認するため、壊れたビルドに遭遇する回数が減り、後始末に費やすターンも少なくて済む。 HN のリリーススレッドにいた開発者 そのモデルを「他のモデルが作ったバグを見つける」ものと表現した。同じスレッドの Canva のエンジニアは「より良い結果をトークン半分で」実現し、レビューするコードの少ない pull request を得たと報告した。この感覚の背景にあるベンチマーク数値を一つ挙げるならば:Anthropic は SWE-Bench Pro で Fable 5 を 80.3%、Opus 4.8 を 69.2% としている。その数値を読む前から、すでに差を感じていた。

変化は速度にあるのではありません。出力が壊れた状態で返ってくることが減ったことです。

手放しで任せられるサブエージェント委任

三段階のリファクタリングを渡したら、私が顔を上げる前に二段階を終えていた。これが二つ目の変化で、予想していなかったものだ。Fable 5 の長期ホライズン動作は、複数段階のタスクを委任すれば、毎回確認のために立ち止まることなく、自力でステージを進めていくことを意味する。これを現実にしているのが Dynamic Workflows、Anthropic の並列サブエージェントオーケストレーション(5月末から一般提供)を使用したもので、標準のシングルセッションモードではありません。HN のスレッドで、あるデベロッパーは Opus が繰り返し失敗していた複雑なデータベースマイグレーションが1回のセッションで完了したと報告しています。

これが本当の注意点で、重要です:Proプランでは30分のウィンドウ内にレート制限に達する可能性があり、さっきまで楽しみにしていた長時間の無人実行が台無しになります。スレッドの開発者の一人は、エージェント作業30分以内に上限に達しました。機能は本物です。Proプランのレート上限も本物です。Maxこそが、常時中断なしに実際に機能する場所です。

委任はついて監視なしで機能するようになった。ただし、Pro ティアは一回分の完全な実行を終える前にレート制限を掛けてくることに注意してほしい。これは実質的に Max プランの勝利だ。

ビジョンタスクはまったく別の体験になった

乱雑な UI コンポーネントのスクリーンショットをセッションに投げ込み、何をしているのかと尋ねた。要素を一つも説明することなく、レイアウトを読み取ってロジックを再構築してみせた。これが三つ目の変化だ。Fable 5 はスクリーンショットやコードベースの図を読み取り、私がこれまで慣れてきた以上に手取り足取りなしで使える出力を返してくれる。HN のスレッドで 30 分かけてストレステストを行った開発者は「UI デザインの視覚的な側面において駅くほど優秀だ」と評していたが、私自身が目にしたものとも一致する。

3つの変化の中で一番地味なものだ。でも、自分が疲れていたと気づいていなかったステップを静かに取り除いてくれるのはこれだ。

唯一イライラすること

単純に実行されるべきタスクを送ったのに、拒否ルートされた Opus の応答として戻ってきました。裏側で起きていること:セーフガードのクラシファイアがサイバーセキュリティ隣接のタスクやいくつかの他の敏感なタスクタイプに反応し、Fable 5 の応答を返す代わりに Opus 4.8 へリクエストをルーティングします。これは応答の中で分かるのであって、送信前ではありません。Anthropic はこれが発生したときにユーザーに通知されると言い、技術的には応答がそれを伝えてはいますが、送信前にタスクがクラシファイアの対象範囲にあるという事前の案内はありません。

分類器の範囲も広い。HN のスレッドでは、ビジネス見込み客発掘ツールで一人の開発者がブロックされ、医療データのパターン分析をしていた別の開発者はそれを自分のケースで使い物にならないと表現した。公平に言えばこれは稀で、Anthropic によると Fable セッションの 95% 以上はそもそも fallback に一切遭遇しない。また、フロンティア AI 研究者に影響する舞台裏のチューニング手法に関する、それとは別のずっと狭い議論もある——一般的な開発者には関係なく、この二つを混同しないでほしい。実際に問題になりうるのは、目に見える Opus フォールバックだ。セーフティルーティングが存在すること自体が問題なのではない。不透明なことが問題で、Fable 5 を期待していたのに後から Opus の回答だったと知るのは不快な体験だ。

優れたモデル、不透明なガードレール。痛いのは安全機能そのものではなく、不透明さだ。

次の1時間で試すこと

Claude Code のデフォルトを Fable 5 に切り替えて、すでに開いているマルチファイルリファクタリングに対して実行してみてください。それが実験の全てです — 1 時間以内に、あなたの作業に対して 2 倍の料金が見合うかどうか分かります。適応的思考は常に有効なので、単純な作業では差が出ません。本当に難しいものでテストしてください。Max や Team をご利用なら、Dynamic Workflows をオンにして、シングルセッションモードではなく委任動作を確認しましょう。そして自分の UI のスクリーンショットを与えて、ビジョンの変化を自分の目で確かめてください。

切り替え自体は /model fable or /model claude-fable-5 (Claude Code v2.1.170以降が必要)。実際の仕事で試して、自分で判断して、タスクが改善されなければOpusに戻せばいい。何も失うものはない。

よくある質問

Claude CodeでFable 5に切り替えるには?

実行 /model fable or /model claude-fable-5 Claude Code内で、またはオプションとして渡す --model claude-fable-5 起動時に指定する。Fable 5がオプションとして表示されるにはClaude Code v2.1.170以降が必要だ。

セーフガードはClaude Codeでの作業をブロックしますか?

ほとんどはNoだ。Anthropicは95%以上のFable 5セッションがフォールバックにまったく当たらないと言っている。ただし、サイバーセキュリティ隣接タスクや一部の健康データタスクはOpus 4.8にルーティングされる可能性がある。発生した場合はレスポンスで通知されるが、事前の警告はないので後から知ることになる。作業がそれらの領域に触れるなら、Fable 5をデフォルトにする前に実際のタスクでテストしよう。

Dynamic Workflowsは通常のエージェントモードと違うの?

はい。Dynamic WorkflowsはAnthropicの並列サブエージェント・オーケストレーション層で、5月末から一般提供され、MaxとTeamプランでデフォルトオンになっている。Fable 5の監視なしマルチステージ委譲が完全に発揮されるのはここで、標準のシングルセッションエージェントモードでは同じ長期的な動作は見られない。

共有

ブログの他の記事

読み進める。

opencode vs openclawの特集。リポジトリベースのAIコーディングエージェントと、OpenClawの自律型AIエージェントゲートウェイを比較。
AIと機械学習

OpenCode vs OpenClaw: 動かすべきセルフホスト型AIツールは?

OpenCode vs OpenClawの選択は概ね、リポジトリ内で動作するコーディングエージェントか、チャットアプリ・ツール・スケジュールタスクをつなぐ常時稼働のアシスタントゲートウェイか、という選択です。

Nick SilverNick Silver 読了14分
opencode vs claude codeのカバー。ローカル vs クラウドのAIコーディング、セルフホスト型の自由度とホスト型の便利さを比較。
AIと機械学習

OpenCode vs Claude Code: ホスト型の便利さか、セルフホスト型の自由度か?

OpenCode vs Claude Codeは、マネージド型のAIコーディングエージェントと、自分の環境で動かせるコーディングエージェントの選択に集約されます。Claude Codeの方が始めやすい理由は

Nick SilverNick Silver 読了13分
claude code代替のカバー。ターミナル、IDE、クラウド、セルフホストのワークフローで開発者向けのおすすめAIツールを紹介。
AIと機械学習

開発者向けClaude Code代替: ターミナル、IDE、セルフホスト、クラウドのワークフロー別おすすめ

Claude Codeは現在も最も強力なコーディングエージェントの一つですが、多くの開発者がワークフロー、モデルアクセス、長期的なコストに基づいてツールを選択するようになっています

Nick SilverNick Silver 読了20分

デプロイの準備はできましたか? 月額2.48ドルから。

2008年から独立運営のクラウド。AMD EPYC、NVMe、40 Gbps。14日間返金保証。