AI活用全般

ClaudeモデルはSonnet7割・Haiku2割・Opus1割が正解|opusplanでコスト68%削減する使い分けルール

この記事の要点

  • ClaudeのOpus固定運用は月中で枠が切れる。現実解は Sonnet7割・Haiku2割・Opus1割 の配分
  • 迷ったら 賢さ/速度/コストの3軸 で30秒判断。表形式で用意した
  • Claude Codeなら /model opusplan 一択。Plan=Opus・Execute=Sonnetの自動切替で コスト約68%削減(DeepWiki計測)
  • 料金比はOpus:Sonnet:Haiku=5:3:1。1回Opusを打つ=Haiku5回分の重み

「一番賢そうだから」でOpusばかり選んで、
月曜の夜に枠切れ通知を食らう。
これ、
Claude Pro/Max契約者あるあるです。
Sonnet固定にしたら今度は肝心な戦略壁打ちで物足りない。
Haiku固定なら提案書の粘りが足りない。

私の答えは 配分ルールと判断軸 を先に決めておくこと。
Sonnet7割・Haiku2割・Opus1割で月の枠と思考の深さを同時に最大化する運用を整理しました。

記事の後半ではClaude Codeの opusplan モードも解説します。
Opusを全タスクで回すと月$1.50かかるところを、
opusplanなら$0.48に落ちる(DeepWikiのコミュニティ計測)。
これ知らずにOpus固定は正直もったいない。

なぜOpus固定は破綻するのか

Pro/MaxのOpus使用枠はAnthropicが具体的数値を公開していません。
公式サポート記事にはこう書かれているだけです。

Claude Code may automatically fall back to Sonnet if you hit a usage threshold with Opus.
(Opusの使用しきい値に達した場合、Claude Codeは自動でSonnetに切り替わる場合があります)

出典: Claude Code model config 公式

つまりOpusで走ってるつもりが勝手にSonnetに落ちる。
これが起きると「同じプロンプトなのに今日は精度が低い」と感じる正体です。
個人的にはこの挙動が一番厄介。
ユーザー側で制御できない部分に品質がぶら下がる構造になってます。

サードパーティ推定値ですが、
hyperealの推定値では Pro=5時間窓でOpus約45メッセージ、
Max 5x=約225、
Max 20x=約900。
公式非公開なので参考値扱いですが、
桁感はつかめます。

さらに2026年3月からピーク時制限が強化され、
5時間セッションクロックが従来より速く進む仕様に変わりました。
Nicholas Rhodesの分析はこう指摘しています。

約7%のユーザーが以前は到達しなかった制限に達するようになった。
Max契約者でも単一プロンプトで使用率が21%から100%に跳ね上がった事例がある。

出典: Nicholas Rhodes「Claude Usage Limits Fix」

Max 20xでもOpus固定は詰む。そういう時代になってます。

配分ルール:Sonnet7割・Haiku2割・Opus1割

月の総使用量を10とした時、私が置いている理想配分はこうです。

モデル配分担当する仕事
Sonnet 4.670%日常の文章生成・コード補助・壁打ちの主力。ほとんどのタスクはここで足りる
Haiku 4.520%メール下書き・短文要約・分類・大量処理。速度重視の単純タスク
Opus 4.710%戦略設計・複雑推論・最終品質チェック。ここぞの一発勝負

この7:2:1が効くのは、
料金比と運用実感が一致するからです。
Anthropic公式料金をもとに計算すると入力も出力も Opus:Sonnet:Haiku=5:3:1
Opusを1発打つのはHaiku5回分の重みがあります。

ここ、意外と盲点。

readyforの検証記事ではOpusの優位をこう書いています。

Opusは3倍賢く、
10倍のおもんぱかり力、
1000倍ストレスフリー。
Sonnetは500倍のストレスを感じる。
Opusは課題をきちんと解消・回避しながらゴール達成。
Sonnetはコスト重視でゴールへの最短距離を走行し、
テストを削除したり仕様を勝手に変更する禁忌肢を採用しやすい。

出典: readyfor「Claude Code Opus vs Sonnet実体験」

このレポートだけ読むと「全部Opusでいいじゃん」と思えます。
ただ冷静に料金を掛け算すると話は変わる。
Sonnetの「禁忌肢」を人間側のレビューで潰せる仕事なら、
Sonnet7割が現実解です。

逆に「禁忌肢を取られると致命傷になる仕事」だけOpusに回す。
これがOpus1割の意味。

判断3軸デシジョンツリー:迷ったら30秒で決める

いま目の前のタスクをどのモデルに振るか。私なら3軸で採点します。

低い(1点)中くらい(2点)高い(3点)
賢さ要求決まった型の文章・分類推敲や構成が必要な文章戦略・設計・複雑推論
速度要求夜間バッチで翌朝まででOK数十秒待てる秒単位で返してほしい
コスト要求月数百件以上の量産日数回の中規模月数回の勝負どころ

振り分けはこう。

  • 賢さ3点 or コスト3点 → Opus 4.7
  • 速度3点 or コスト1点(量産) → Haiku 4.5
  • それ以外 → Sonnet 4.6(デフォルトはここ)

迷った時はSonnet。
個人的には、
この「迷ったらSonnet」のルールを持っておくだけで月のOpus消費が3割は落ちるはずです。

Haikuの強みは速度だけじゃない。
ServerWorksの実測では週報生成タスクでこうなってます。

Haiku 4.5は30秒前後の処理が圧倒的。
Opus 4.6は3分37秒〜5分30秒要する。
コストもHaikuがOpusの約1/15(0.12ドル vs 1.77ドル)。

出典: ServerWorksブログ「Claudeモデル選定ガイド」

1/15ですよ。
大量処理ならHaikuで回して人間が最終チェック、
これで品質とコストの両取りが成立します。

Claude Codeユーザー必読:opusplanモード

ここからはClaude Codeを触っている人向け。
/model opusplan は運用のゲームチェンジャーです。
公式仕様はこう定義しています。

opusplan: Special mode that uses opus during plan mode, then switches to sonnet for execution.
(opusplan: プランモードではopusを使い、実行時にはsonnetに切り替わる特殊モード)

出典: Claude Code model config

Plan modeで設計・アーキテクチャ判断をOpus 4.7が担当。
コード生成・実装フェーズはSonnet 4.6が受け取る。
人間のPM+エンジニアの分業をそのまま再現する発想です。

コスト効果はDeepWikiのコミュニティ計測に具体数字があります。

モード計画フェーズ実装フェーズ合計
all-Opus$0.22$1.28$1.50
opusplan$0.22$0.26$0.48
削減率±0−80%−68%

計画フェーズのトークンは全開発サイクルの10〜20%。
「考える部分」の比率は低くて、
実装フェーズがコスト総額を支配してる。
そこをSonnet単価で回せば68%落ちる、
という構造です。

ちなみにopusplan vs all-Sonnetだと約60%高くなる。
ただ DeepWikiはこう締めています。

The small premium over all-Sonnet (60%) pays for itself by preventing design errors that would require 2-3x rework iterations.
(all-Sonnetに対する60%の上乗せは、2〜3倍の手戻りを要する設計エラーを防ぐことで回収される)

設計段階の判断ミスは実装で3倍のコストで跳ね返る。
Opusで先に型を固める価値はそこです。

使い方はセッション中にこれだけ。

# 起動時に指定
claude --model opusplan

# セッション中に切替
/model opusplan

# デフォルト(Max/Team PremiumはOpus、
Pro/APIはSonnet)に戻す /model default

注意点が1つ。
公式ドキュメントによると、
opusplanのPlan modeは 200kコンテキストで動作(standalone opusの1Mは適用されない)。
大規模コードベースで文脈が切れる可能性があります。
モノリポ全体を読ませる計画立案には/model opus(1Mあり)の方が向く局面があるはず。

ここは用途で使い分け。

Pro契約のままOpus枠を延ばす運用

Pro=$20/月、
Max 5x=$100/月、
Max 20x=$200/月。
Max 20xなら20倍のOpus枠が手に入るわけですが、
毎月$180の差は小さくない。
Pro維持でOpusを延ばす運用を整理します。

  1. 壁打ち・設計の最初だけOpus、詰めて回すのはSonnet。opusplanの発想を手動でやるだけです
  2. 新規チャットを立て直すNicholas Rhodesの分析によれば、会話ターン50番目のメッセージは新規チャットの同じ質問と比べて「何倍もトークンを消費する」。長い会話は文脈全文を毎回読み込むため
  3. ピーク時はHaikuに逃がす(米国平日5am〜11am PT / 1pm〜7pm GMT)。同じタスクでも消費レートが違う
  4. Settings > Usage で毎週確認。勘で走らない。Nicholas Rhodesの事例では「特定の1タスクが全体予算の54%を消費」していた。見つければ年$338削減の余地があった

Proユーザーが月Opusを使い切る最大原因は、
長い1つの会話スレッドをOpusで引っ張り続けることだと私は見ています。
新規チャットに切るだけで体感が変わります。

モデル別スペック(参考)

運用ノウハウが本題なので、スペック表は判断3軸と紐づく最小限だけ載せます。

項目Opus 4.7Sonnet 4.6Haiku 4.5
入力料金(100万トークン)$5$3$1
出力料金(100万トークン)$25$15$5
コンテキストウィンドウ1M1M200k
最大出力128kトークン64kトークン64kトークン
Extended thinking非対応対応対応
Adaptive thinking対応対応非対応
相対レイテンシModerateFastFastest
Knowledge cutoff2026年1月2025年8月2025年2月

出典: Anthropic公式モデル概要

Opus 4.7は新トークナイザーが導入されており、
同一入力で 1.0〜1.35倍のトークン消費増 の可能性があります。
料金単価は変わらなくても実効コストが上がる余地がある、
という話です(claudefa.st のベストプラクティス)。

配分計算をする時、
私は安全側に1.2倍で見積もっておくのが現実的な線かなと思ってます。

1日の運用フロー例

7:2:1配分と判断3軸を実際のスケジュールに落とすとこうなります。

  1. 朝イチ(Haiku):受信メール要約、今日のタスク分類、短文の返信下書き
  2. 午前(Sonnet):メインの記事執筆・コード補助・壁打ち全般
  3. 午後(Opus 1発):戦略ミーティングの論点整理、提案書のロジック設計。ここだけ賢さに全振り
  4. 夕方(Sonnet):Opusで出た設計をSonnetで具体化・長文展開
  5. 夜(Haiku):日報・週報・軽いリサーチ要約

Opusは1日1発。
これでMax 5xなら余裕、
Pro契約でもギリギリ回る体感になるはずです。

Opusを1日1発に絞るだけで月の枠切れは相当減る。これは運用の骨です。

FAQ

Q. Opus 4.7だけ使えば間違いないのでは?

間違いなくはあるけれど、
月の枠が切れる。
公式も「Claude Codeは使用しきい値に達するとSonnetに自動フォールバックする場合がある」と明記しています。
Opus固定は実質Sonnetで動いてる時間が出てくる運用で、
それなら最初からSonnet主力+Opusは狙い撃ちの方がストレスが少ないです。

Q. opusplanはPlan modeのコンテキストが200kと聞きました。困らないですか?

小中規模プロジェクトなら問題なし。
モノリポ全体を読ませる場面では /model opus(1Mあり)の方が向きます。
公式ドキュメントの注意書き通りです。

Q. Haiku 4.5は本当にビジネス用途で使えますか?

定型タスクなら十分。
ServerWorksの実測ではHaiku 4.5は週報生成をOpus 4.6の約1/15のコストで完了できています。
ただし同記事は「情報収集の深さを犠牲にしている」と付記しています。
ゼロから構想を練るタスクには不向き、
というのは頭に入れておいた方がいいです。

Q. Pro契約のままOpus枠を延ばす一番効く施策は?

長い会話を引きずらないこと。
Nicholas Rhodesの指摘で、
会話ターン50番目のメッセージは新規チャットより「何倍も」トークンを消費します。
Opus案件ごとに新規スレッドを立てる、
これだけで体感は変わります。

Q. 7:2:1配分は全員に当てはまりますか?

現場向けの現実解として置いた数字。
エンジニアでコード生成が主業務なら Sonnet8割・Opus1割・Haiku1割、
大量処理主体のオペレーション業務なら Haiku5割・Sonnet4割・Opus1割、
というように担当業務で寄せてOKです。
共通するのは Opus1割 の上限。
ここを超えるとだいたい月中で詰まります。

まとめ

Claudeのモデル選択は「一番賢そうな奴」で決めると必ず詰まります。
Sonnet7割・Haiku2割・Opus1割の配分ルールと、
賢さ/速度/コストの3軸判断で大半のタスクは機械的に振れる。
Claude CodeユーザーはさらにopusplanでPlan=Opus・Execute=Sonnetのハイブリッドを自動化できる。
コミュニティ計測で約68%のコスト削減です。

Opusは温存してこそ効く。
1日1発、
ここぞで打つ武器として扱う方が結果的に思考の質も上がる、
というのが私の見方です。

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, ,

← 戻る