この記事の要点
- ClaudeのOpus固定運用は月中で枠が切れる。現実解は Sonnet7割・Haiku2割・Opus1割 の配分
- 迷ったら 賢さ/速度/コストの3軸 で30秒判断。表形式で用意した
- Claude Codeなら
/model opusplan一択。Plan=Opus・Execute=Sonnetの自動切替で コスト約68%削減(DeepWiki計測) - 料金比はOpus:Sonnet:Haiku=5:3:1。1回Opusを打つ=Haiku5回分の重み
「一番賢そうだから」でOpusばかり選んで、
月曜の夜に枠切れ通知を食らう。
これ、
Claude Pro/Max契約者あるあるです。
Sonnet固定にしたら今度は肝心な戦略壁打ちで物足りない。
Haiku固定なら提案書の粘りが足りない。
私の答えは 配分ルールと判断軸 を先に決めておくこと。
Sonnet7割・Haiku2割・Opus1割で月の枠と思考の深さを同時に最大化する運用を整理しました。
記事の後半ではClaude Codeの opusplan モードも解説します。
Opusを全タスクで回すと月$1.50かかるところを、
opusplanなら$0.48に落ちる(DeepWikiのコミュニティ計測)。
これ知らずにOpus固定は正直もったいない。
なぜOpus固定は破綻するのか
Pro/MaxのOpus使用枠はAnthropicが具体的数値を公開していません。
公式サポート記事にはこう書かれているだけです。
Claude Code may automatically fall back to Sonnet if you hit a usage threshold with Opus.
(Opusの使用しきい値に達した場合、Claude Codeは自動でSonnetに切り替わる場合があります)
つまりOpusで走ってるつもりが勝手にSonnetに落ちる。
これが起きると「同じプロンプトなのに今日は精度が低い」と感じる正体です。
個人的にはこの挙動が一番厄介。
ユーザー側で制御できない部分に品質がぶら下がる構造になってます。
サードパーティ推定値ですが、
hyperealの推定値では Pro=5時間窓でOpus約45メッセージ、
Max 5x=約225、
Max 20x=約900。
公式非公開なので参考値扱いですが、
桁感はつかめます。
さらに2026年3月からピーク時制限が強化され、
5時間セッションクロックが従来より速く進む仕様に変わりました。
Nicholas Rhodesの分析はこう指摘しています。
約7%のユーザーが以前は到達しなかった制限に達するようになった。
Max契約者でも単一プロンプトで使用率が21%から100%に跳ね上がった事例がある。
Max 20xでもOpus固定は詰む。そういう時代になってます。
配分ルール:Sonnet7割・Haiku2割・Opus1割
月の総使用量を10とした時、私が置いている理想配分はこうです。
| モデル | 配分 | 担当する仕事 |
|---|---|---|
| Sonnet 4.6 | 70% | 日常の文章生成・コード補助・壁打ちの主力。ほとんどのタスクはここで足りる |
| Haiku 4.5 | 20% | メール下書き・短文要約・分類・大量処理。速度重視の単純タスク |
| Opus 4.7 | 10% | 戦略設計・複雑推論・最終品質チェック。ここぞの一発勝負 |
この7:2:1が効くのは、
料金比と運用実感が一致するからです。
Anthropic公式料金をもとに計算すると入力も出力も Opus:Sonnet:Haiku=5:3:1。
Opusを1発打つのはHaiku5回分の重みがあります。
ここ、意外と盲点。
readyforの検証記事ではOpusの優位をこう書いています。
Opusは3倍賢く、
10倍のおもんぱかり力、
1000倍ストレスフリー。
Sonnetは500倍のストレスを感じる。
Opusは課題をきちんと解消・回避しながらゴール達成。
Sonnetはコスト重視でゴールへの最短距離を走行し、
テストを削除したり仕様を勝手に変更する禁忌肢を採用しやすい。
このレポートだけ読むと「全部Opusでいいじゃん」と思えます。
ただ冷静に料金を掛け算すると話は変わる。
Sonnetの「禁忌肢」を人間側のレビューで潰せる仕事なら、
Sonnet7割が現実解です。
逆に「禁忌肢を取られると致命傷になる仕事」だけOpusに回す。
これがOpus1割の意味。
判断3軸デシジョンツリー:迷ったら30秒で決める
いま目の前のタスクをどのモデルに振るか。私なら3軸で採点します。
| 軸 | 低い(1点) | 中くらい(2点) | 高い(3点) |
|---|---|---|---|
| 賢さ要求 | 決まった型の文章・分類 | 推敲や構成が必要な文章 | 戦略・設計・複雑推論 |
| 速度要求 | 夜間バッチで翌朝まででOK | 数十秒待てる | 秒単位で返してほしい |
| コスト要求 | 月数百件以上の量産 | 日数回の中規模 | 月数回の勝負どころ |
振り分けはこう。
- 賢さ3点 or コスト3点 → Opus 4.7
- 速度3点 or コスト1点(量産) → Haiku 4.5
- それ以外 → Sonnet 4.6(デフォルトはここ)
迷った時はSonnet。
個人的には、
この「迷ったらSonnet」のルールを持っておくだけで月のOpus消費が3割は落ちるはずです。
Haikuの強みは速度だけじゃない。
ServerWorksの実測では週報生成タスクでこうなってます。
Haiku 4.5は30秒前後の処理が圧倒的。
Opus 4.6は3分37秒〜5分30秒要する。
コストもHaikuがOpusの約1/15(0.12ドル vs 1.77ドル)。
1/15ですよ。
大量処理ならHaikuで回して人間が最終チェック、
これで品質とコストの両取りが成立します。
Claude Codeユーザー必読:opusplanモード
ここからはClaude Codeを触っている人向け。/model opusplan は運用のゲームチェンジャーです。
公式仕様はこう定義しています。
opusplan: Special mode that uses opus during plan mode, then switches to sonnet for execution.
(opusplan: プランモードではopusを使い、実行時にはsonnetに切り替わる特殊モード)
Plan modeで設計・アーキテクチャ判断をOpus 4.7が担当。
コード生成・実装フェーズはSonnet 4.6が受け取る。
人間のPM+エンジニアの分業をそのまま再現する発想です。
コスト効果はDeepWikiのコミュニティ計測に具体数字があります。
| モード | 計画フェーズ | 実装フェーズ | 合計 |
|---|---|---|---|
| all-Opus | $0.22 | $1.28 | $1.50 |
| opusplan | $0.22 | $0.26 | $0.48 |
| 削減率 | ±0 | −80% | −68% |
計画フェーズのトークンは全開発サイクルの10〜20%。
「考える部分」の比率は低くて、
実装フェーズがコスト総額を支配してる。
そこをSonnet単価で回せば68%落ちる、
という構造です。
ちなみにopusplan vs all-Sonnetだと約60%高くなる。
ただ DeepWikiはこう締めています。
The small premium over all-Sonnet (60%) pays for itself by preventing design errors that would require 2-3x rework iterations.
(all-Sonnetに対する60%の上乗せは、2〜3倍の手戻りを要する設計エラーを防ぐことで回収される)
設計段階の判断ミスは実装で3倍のコストで跳ね返る。
Opusで先に型を固める価値はそこです。
使い方はセッション中にこれだけ。
# 起動時に指定
claude --model opusplan
# セッション中に切替
/model opusplan
# デフォルト(Max/Team PremiumはOpus、
Pro/APIはSonnet)に戻す
/model default
注意点が1つ。
公式ドキュメントによると、
opusplanのPlan modeは 200kコンテキストで動作(standalone opusの1Mは適用されない)。
大規模コードベースで文脈が切れる可能性があります。
モノリポ全体を読ませる計画立案には/model opus(1Mあり)の方が向く局面があるはず。
ここは用途で使い分け。
Pro契約のままOpus枠を延ばす運用
Pro=$20/月、
Max 5x=$100/月、
Max 20x=$200/月。
Max 20xなら20倍のOpus枠が手に入るわけですが、
毎月$180の差は小さくない。
Pro維持でOpusを延ばす運用を整理します。
- 壁打ち・設計の最初だけOpus、詰めて回すのはSonnet。opusplanの発想を手動でやるだけです
- 新規チャットを立て直す。Nicholas Rhodesの分析によれば、会話ターン50番目のメッセージは新規チャットの同じ質問と比べて「何倍もトークンを消費する」。長い会話は文脈全文を毎回読み込むため
- ピーク時はHaikuに逃がす(米国平日5am〜11am PT / 1pm〜7pm GMT)。同じタスクでも消費レートが違う
- Settings > Usage で毎週確認。勘で走らない。Nicholas Rhodesの事例では「特定の1タスクが全体予算の54%を消費」していた。見つければ年$338削減の余地があった
Proユーザーが月Opusを使い切る最大原因は、
長い1つの会話スレッドをOpusで引っ張り続けることだと私は見ています。
新規チャットに切るだけで体感が変わります。
モデル別スペック(参考)
運用ノウハウが本題なので、スペック表は判断3軸と紐づく最小限だけ載せます。
| 項目 | Opus 4.7 | Sonnet 4.6 | Haiku 4.5 |
|---|---|---|---|
| 入力料金(100万トークン) | $5 | $3 | $1 |
| 出力料金(100万トークン) | $25 | $15 | $5 |
| コンテキストウィンドウ | 1M | 1M | 200k |
| 最大出力 | 128kトークン | 64kトークン | 64kトークン |
| Extended thinking | 非対応 | 対応 | 対応 |
| Adaptive thinking | 対応 | 対応 | 非対応 |
| 相対レイテンシ | Moderate | Fast | Fastest |
| Knowledge cutoff | 2026年1月 | 2025年8月 | 2025年2月 |
出典: Anthropic公式モデル概要
Opus 4.7は新トークナイザーが導入されており、
同一入力で 1.0〜1.35倍のトークン消費増 の可能性があります。
料金単価は変わらなくても実効コストが上がる余地がある、
という話です(claudefa.st のベストプラクティス)。
配分計算をする時、
私は安全側に1.2倍で見積もっておくのが現実的な線かなと思ってます。
1日の運用フロー例
7:2:1配分と判断3軸を実際のスケジュールに落とすとこうなります。
- 朝イチ(Haiku):受信メール要約、今日のタスク分類、短文の返信下書き
- 午前(Sonnet):メインの記事執筆・コード補助・壁打ち全般
- 午後(Opus 1発):戦略ミーティングの論点整理、提案書のロジック設計。ここだけ賢さに全振り
- 夕方(Sonnet):Opusで出た設計をSonnetで具体化・長文展開
- 夜(Haiku):日報・週報・軽いリサーチ要約
Opusは1日1発。
これでMax 5xなら余裕、
Pro契約でもギリギリ回る体感になるはずです。
Opusを1日1発に絞るだけで月の枠切れは相当減る。これは運用の骨です。
FAQ
Q. Opus 4.7だけ使えば間違いないのでは?
間違いなくはあるけれど、
月の枠が切れる。
公式も「Claude Codeは使用しきい値に達するとSonnetに自動フォールバックする場合がある」と明記しています。
Opus固定は実質Sonnetで動いてる時間が出てくる運用で、
それなら最初からSonnet主力+Opusは狙い撃ちの方がストレスが少ないです。
Q. opusplanはPlan modeのコンテキストが200kと聞きました。困らないですか?
小中規模プロジェクトなら問題なし。
モノリポ全体を読ませる場面では /model opus(1Mあり)の方が向きます。
公式ドキュメントの注意書き通りです。
Q. Haiku 4.5は本当にビジネス用途で使えますか?
定型タスクなら十分。
ServerWorksの実測ではHaiku 4.5は週報生成をOpus 4.6の約1/15のコストで完了できています。
ただし同記事は「情報収集の深さを犠牲にしている」と付記しています。
ゼロから構想を練るタスクには不向き、
というのは頭に入れておいた方がいいです。
Q. Pro契約のままOpus枠を延ばす一番効く施策は?
長い会話を引きずらないこと。
Nicholas Rhodesの指摘で、
会話ターン50番目のメッセージは新規チャットより「何倍も」トークンを消費します。
Opus案件ごとに新規スレッドを立てる、
これだけで体感は変わります。
Q. 7:2:1配分は全員に当てはまりますか?
現場向けの現実解として置いた数字。
エンジニアでコード生成が主業務なら Sonnet8割・Opus1割・Haiku1割、
大量処理主体のオペレーション業務なら Haiku5割・Sonnet4割・Opus1割、
というように担当業務で寄せてOKです。
共通するのは Opus1割 の上限。
ここを超えるとだいたい月中で詰まります。
まとめ
Claudeのモデル選択は「一番賢そうな奴」で決めると必ず詰まります。
Sonnet7割・Haiku2割・Opus1割の配分ルールと、
賢さ/速度/コストの3軸判断で大半のタスクは機械的に振れる。
Claude CodeユーザーはさらにopusplanでPlan=Opus・Execute=Sonnetのハイブリッドを自動化できる。
コミュニティ計測で約68%のコスト削減です。
Opusは温存してこそ効く。
1日1発、
ここぞで打つ武器として扱う方が結果的に思考の質も上がる、
というのが私の見方です。
参考リンク
- Anthropic公式モデル概要: https://platform.claude.com/docs/en/about-claude/models/overview
- Claude料金ページ: https://claude.com/pricing
- Claude Code model config公式: https://code.claude.com/docs/en/model-config
- opusplan 68%削減の根拠(DeepWiki): https://deepwiki.com/FlorianBruniaux/claude-code-ultimate-guide/11.2-session-logging-and-statistics
- Claude Pro/Max週次レート制限ガイド(hypereal・推定値): https://hypereal.cloud/a/weekly-rate-limits-claude-pro-max-guide
- Claude使用枠消耗問題の分析(Nicholas Rhodes): https://nicholasrhodes.substack.com/p/claude-usage-limits-fix
- Claude Code Opus vs Sonnet実体験(readyfor): https://zenn.dev/readyfor_blog/articles/11d4e6b6129428
- ServerWorksモデル比較検証: https://blog.serverworks.co.jp/claude-model-selection-guide-opus-sonnet-haiku
- Opus 4.7 Best Practices(claudefa.st): https://claudefa.st/blog/guide/development/opus-4-7-best-practices
※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。