Haiku 4.5はビジネス用途で使えますか？

定型タスクなら十分。ServerWorksの実測ではHaiku 4.5は週報生成をOpus 4.6の約1/15のコストで完了できる。ただし情報収集の深さを犠牲にしているため、ゼロから構想を練るタスクには不向き。

ClaudeモデルはSonnet7割・Haiku2割・Opus1割が正解｜opusplanでコスト68%削減する使い分けルール

この記事の要点

ClaudeのOpus固定運用は月中で枠が切れる。現実解は Sonnet7割・Haiku2割・Opus1割 の配分
迷ったら 賢さ／速度／コストの3軸 で30秒判断。表形式で用意した
Claude Codeなら /model opusplan 一択。Plan=Opus・Execute=Sonnetの自動切替で コスト約68%削減（DeepWiki計測）
料金比はOpus:Sonnet:Haiku=5:3:1。1回Opusを打つ=Haiku5回分の重み

「一番賢そうだから」でOpusばかり選んで、
月曜の夜に枠切れ通知を食らう。
これ、
Claude Pro/Max契約者あるあるです。
Sonnet固定にしたら今度は肝心な戦略壁打ちで物足りない。
Haiku固定なら提案書の粘りが足りない。

私の答えは 配分ルールと判断軸 を先に決めておくこと。
Sonnet7割・Haiku2割・Opus1割で月の枠と思考の深さを同時に最大化する運用を整理しました。

記事の後半ではClaude Codeの opusplan モードも解説します。
Opusを全タスクで回すと月$1.50かかるところを、
opusplanなら$0.48に落ちる（DeepWikiのコミュニティ計測）。
これ知らずにOpus固定は正直もったいない。

なぜOpus固定は破綻するのか

Pro/MaxのOpus使用枠はAnthropicが具体的数値を公開していません。
公式サポート記事にはこう書かれているだけです。

Claude Code may automatically fall back to Sonnet if you hit a usage threshold with Opus.
（Opusの使用しきい値に達した場合、Claude Codeは自動でSonnetに切り替わる場合があります）

出典: Claude Code model config 公式

つまりOpusで走ってるつもりが勝手にSonnetに落ちる。
これが起きると「同じプロンプトなのに今日は精度が低い」と感じる正体です。
個人的にはこの挙動が一番厄介。
ユーザー側で制御できない部分に品質がぶら下がる構造になってます。

サードパーティ推定値ですが、
hyperealの推定値では Pro=5時間窓でOpus約45メッセージ、
Max 5x=約225、
Max 20x=約900。
公式非公開なので参考値扱いですが、
桁感はつかめます。

さらに2026年3月からピーク時制限が強化され、
5時間セッションクロックが従来より速く進む仕様に変わりました。
Nicholas Rhodesの分析はこう指摘しています。

約7%のユーザーが以前は到達しなかった制限に達するようになった。
Max契約者でも単一プロンプトで使用率が21%から100%に跳ね上がった事例がある。

出典: Nicholas Rhodes「Claude Usage Limits Fix」

Max 20xでもOpus固定は詰む。そういう時代になってます。

配分ルール：Sonnet7割・Haiku2割・Opus1割

月の総使用量を10とした時、私が置いている理想配分はこうです。

モデル	配分	担当する仕事
Sonnet 4.6	70%	日常の文章生成・コード補助・壁打ちの主力。ほとんどのタスクはここで足りる
Haiku 4.5	20%	メール下書き・短文要約・分類・大量処理。速度重視の単純タスク
Opus 4.7	10%	戦略設計・複雑推論・最終品質チェック。ここぞの一発勝負

この7:2:1が効くのは、
料金比と運用実感が一致するからです。
Anthropic公式料金をもとに計算すると入力も出力も Opus:Sonnet:Haiku=5:3:1。
Opusを1発打つのはHaiku5回分の重みがあります。

ここ、意外と盲点。

readyforの検証記事ではOpusの優位をこう書いています。

Opusは3倍賢く、
10倍のおもんぱかり力、
1000倍ストレスフリー。
Sonnetは500倍のストレスを感じる。
Opusは課題をきちんと解消・回避しながらゴール達成。
Sonnetはコスト重視でゴールへの最短距離を走行し、
テストを削除したり仕様を勝手に変更する禁忌肢を採用しやすい。

出典: readyfor「Claude Code Opus vs Sonnet実体験」

このレポートだけ読むと「全部Opusでいいじゃん」と思えます。
ただ冷静に料金を掛け算すると話は変わる。
Sonnetの「禁忌肢」を人間側のレビューで潰せる仕事なら、
Sonnet7割が現実解です。

逆に「禁忌肢を取られると致命傷になる仕事」だけOpusに回す。
これがOpus1割の意味。

判断3軸デシジョンツリー：迷ったら30秒で決める

いま目の前のタスクをどのモデルに振るか。私なら3軸で採点します。

軸	低い（1点）	中くらい（2点）	高い（3点）
賢さ要求	決まった型の文章・分類	推敲や構成が必要な文章	戦略・設計・複雑推論
速度要求	夜間バッチで翌朝まででOK	数十秒待てる	秒単位で返してほしい
コスト要求	月数百件以上の量産	日数回の中規模	月数回の勝負どころ

振り分けはこう。

賢さ3点 or コスト3点 → Opus 4.7
速度3点 or コスト1点（量産） → Haiku 4.5
それ以外 → Sonnet 4.6（デフォルトはここ）

迷った時はSonnet。
個人的には、
この「迷ったらSonnet」のルールを持っておくだけで月のOpus消費が3割は落ちるはずです。

Haikuの強みは速度だけじゃない。
ServerWorksの実測では週報生成タスクでこうなってます。

Haiku 4.5は30秒前後の処理が圧倒的。
Opus 4.6は3分37秒〜5分30秒要する。
コストもHaikuがOpusの約1/15（0.12ドル vs 1.77ドル）。

出典: ServerWorksブログ「Claudeモデル選定ガイド」

1/15ですよ。
大量処理ならHaikuで回して人間が最終チェック、
これで品質とコストの両取りが成立します。

Claude Codeユーザー必読：opusplanモード

ここからはClaude Codeを触っている人向け。
/model opusplan は運用のゲームチェンジャーです。
公式仕様はこう定義しています。

opusplan: Special mode that uses opus during plan mode, then switches to sonnet for execution.
（opusplan: プランモードではopusを使い、実行時にはsonnetに切り替わる特殊モード）

出典: Claude Code model config

Plan modeで設計・アーキテクチャ判断をOpus 4.7が担当。
コード生成・実装フェーズはSonnet 4.6が受け取る。
人間のPM+エンジニアの分業をそのまま再現する発想です。

コスト効果はDeepWikiのコミュニティ計測に具体数字があります。

モード	計画フェーズ	実装フェーズ	合計
all-Opus	$0.22	$1.28	$1.50
opusplan	$0.22	$0.26	$0.48
削減率	±0	−80%	−68%

計画フェーズのトークンは全開発サイクルの10〜20%。
「考える部分」の比率は低くて、
実装フェーズがコスト総額を支配してる。
そこをSonnet単価で回せば68%落ちる、
という構造です。

ちなみにopusplan vs all-Sonnetだと約60%高くなる。
ただ DeepWikiはこう締めています。

The small premium over all-Sonnet (60%) pays for itself by preventing design errors that would require 2-3x rework iterations.
（all-Sonnetに対する60%の上乗せは、2〜3倍の手戻りを要する設計エラーを防ぐことで回収される）

設計段階の判断ミスは実装で3倍のコストで跳ね返る。
Opusで先に型を固める価値はそこです。

使い方はセッション中にこれだけ。

# 起動時に指定
claude --model opusplan

# セッション中に切替
/model opusplan

# デフォルト（Max/Team PremiumはOpus、
Pro/APIはSonnet）に戻す
/model default

注意点が1つ。
公式ドキュメントによると、
opusplanのPlan modeは 200kコンテキストで動作（standalone opusの1Mは適用されない）。
大規模コードベースで文脈が切れる可能性があります。
モノリポ全体を読ませる計画立案には/model opus（1Mあり）の方が向く局面があるはず。

ここは用途で使い分け。

Pro契約のままOpus枠を延ばす運用

Pro=$20/月、
Max 5x=$100/月、
Max 20x=$200/月。
Max 20xなら20倍のOpus枠が手に入るわけですが、
毎月$180の差は小さくない。
Pro維持でOpusを延ばす運用を整理します。

壁打ち・設計の最初だけOpus、詰めて回すのはSonnet。opusplanの発想を手動でやるだけです
新規チャットを立て直す。Nicholas Rhodesの分析によれば、会話ターン50番目のメッセージは新規チャットの同じ質問と比べて「何倍もトークンを消費する」。長い会話は文脈全文を毎回読み込むため
ピーク時はHaikuに逃がす（米国平日5am〜11am PT / 1pm〜7pm GMT）。同じタスクでも消費レートが違う
Settings > Usage で毎週確認。勘で走らない。Nicholas Rhodesの事例では「特定の1タスクが全体予算の54%を消費」していた。見つければ年$338削減の余地があった

Proユーザーが月Opusを使い切る最大原因は、
長い1つの会話スレッドをOpusで引っ張り続けることだと私は見ています。
新規チャットに切るだけで体感が変わります。

モデル別スペック（参考）

運用ノウハウが本題なので、スペック表は判断3軸と紐づく最小限だけ載せます。

項目	Opus 4.7	Sonnet 4.6	Haiku 4.5
入力料金（100万トークン）	$5	$3	$1
出力料金（100万トークン）	$25	$15	$5
コンテキストウィンドウ	1M	1M	200k
最大出力	128kトークン	64kトークン	64kトークン
Extended thinking	非対応	対応	対応
Adaptive thinking	対応	対応	非対応
相対レイテンシ	Moderate	Fast	Fastest
Knowledge cutoff	2026年1月	2025年8月	2025年2月

出典: Anthropic公式モデル概要

Opus 4.7は新トークナイザーが導入されており、
同一入力で 1.0〜1.35倍のトークン消費増 の可能性があります。
料金単価は変わらなくても実効コストが上がる余地がある、
という話です（claudefa.st のベストプラクティス）。

配分計算をする時、
私は安全側に1.2倍で見積もっておくのが現実的な線かなと思ってます。

1日の運用フロー例

7:2:1配分と判断3軸を実際のスケジュールに落とすとこうなります。

朝イチ（Haiku）：受信メール要約、今日のタスク分類、短文の返信下書き
午前（Sonnet）：メインの記事執筆・コード補助・壁打ち全般
午後（Opus 1発）：戦略ミーティングの論点整理、提案書のロジック設計。ここだけ賢さに全振り
夕方（Sonnet）：Opusで出た設計をSonnetで具体化・長文展開
夜（Haiku）：日報・週報・軽いリサーチ要約

Opusは1日1発。
これでMax 5xなら余裕、
Pro契約でもギリギリ回る体感になるはずです。

Opusを1日1発に絞るだけで月の枠切れは相当減る。これは運用の骨です。

FAQ

Q. Opus 4.7だけ使えば間違いないのでは？

間違いなくはあるけれど、
月の枠が切れる。
公式も「Claude Codeは使用しきい値に達するとSonnetに自動フォールバックする場合がある」と明記しています。
Opus固定は実質Sonnetで動いてる時間が出てくる運用で、
それなら最初からSonnet主力+Opusは狙い撃ちの方がストレスが少ないです。

Q. opusplanはPlan modeのコンテキストが200kと聞きました。困らないですか？

小中規模プロジェクトなら問題なし。
モノリポ全体を読ませる場面では /model opus（1Mあり）の方が向きます。
公式ドキュメントの注意書き通りです。

Q. Haiku 4.5は本当にビジネス用途で使えますか？

定型タスクなら十分。
ServerWorksの実測ではHaiku 4.5は週報生成をOpus 4.6の約1/15のコストで完了できています。
ただし同記事は「情報収集の深さを犠牲にしている」と付記しています。
ゼロから構想を練るタスクには不向き、
というのは頭に入れておいた方がいいです。

Q. Pro契約のままOpus枠を延ばす一番効く施策は？

長い会話を引きずらないこと。
Nicholas Rhodesの指摘で、
会話ターン50番目のメッセージは新規チャットより「何倍も」トークンを消費します。
Opus案件ごとに新規スレッドを立てる、
これだけで体感は変わります。

Q. 7:2:1配分は全員に当てはまりますか？

現場向けの現実解として置いた数字。
エンジニアでコード生成が主業務なら Sonnet8割・Opus1割・Haiku1割、
大量処理主体のオペレーション業務なら Haiku5割・Sonnet4割・Opus1割、
というように担当業務で寄せてOKです。
共通するのは Opus1割 の上限。
ここを超えるとだいたい月中で詰まります。

まとめ

Claudeのモデル選択は「一番賢そうな奴」で決めると必ず詰まります。
Sonnet7割・Haiku2割・Opus1割の配分ルールと、
賢さ／速度／コストの3軸判断で大半のタスクは機械的に振れる。
Claude CodeユーザーはさらにopusplanでPlan=Opus・Execute=Sonnetのハイブリッドを自動化できる。
コミュニティ計測で約68%のコスト削減です。

Opusは温存してこそ効く。
1日1発、
ここぞで打つ武器として扱う方が結果的に思考の質も上がる、
というのが私の見方です。

参考リンク

Anthropic公式モデル概要: https://platform.claude.com/docs/en/about-claude/models/overview
Claude料金ページ: https://claude.com/pricing
Claude Code model config公式: https://code.claude.com/docs/en/model-config
opusplan 68%削減の根拠（DeepWiki）: https://deepwiki.com/FlorianBruniaux/claude-code-ultimate-guide/11.2-session-logging-and-statistics
Claude Pro/Max週次レート制限ガイド（hypereal・推定値）: https://hypereal.cloud/a/weekly-rate-limits-claude-pro-max-guide
Claude使用枠消耗問題の分析（Nicholas Rhodes）: https://nicholasrhodes.substack.com/p/claude-usage-limits-fix
Claude Code Opus vs Sonnet実体験（readyfor）: https://zenn.dev/readyfor_blog/articles/11d4e6b6129428
ServerWorksモデル比較検証: https://blog.serverworks.co.jp/claude-model-selection-guide-opus-sonnet-haiku
Opus 4.7 Best Practices（claudefa.st）: https://claudefa.st/blog/guide/development/opus-4-7-best-practices

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。