Claude Opus 4.7は英語プロンプトで実質4割値上げ｜tokenizer変更の実測1.46倍とSonnet4.6/Haiku4.5併用の3段階対策

2026年5月18日

公開日: 2026年4月21日／最終更新: 2026年5月18日

Claude Opus 4.7のper-token単価は入力$5／出力$25／100万トークンでOpus 4.6と同額。

単価表は1セントも動いていません。

ただSimon Willisonの実測では、同じ英語テキストで消費トークンが5,039→7,335（1.46倍）に膨らみます。

新tokenizerが入ったので、同じ仕事に対する請求額が約4割増えるという話。

影響はPro $20／Max $100／API従量で全く別物。

私の判断では、Opus 4.7は難問だけに回し、日常はSonnet 4.6、長文はHaiku 4.5で先に圧縮、という3段使い分けが一番効く対策です。

この記事はClaude APIを従量課金で叩いている開発者・英語プロンプトを常時走らせている運用者向け（API利用料金とトークン課金の基本が分かる前提）。

Claude Opus 4.7のper-token単価は、入力$5／出力$25／100万トークンでOpus 4.6から変わっていません（Anthropic公式モデル一覧）。

ただ、同じ英語テキストをOpus 4.6と4.7に通すと、消費トークン数が1.46倍に増えることをSimon Willisonが計測で示しています（Claude Token Counter, now with model comparisons, 2026-04-20）。

単価据え置きで請求額4割増。

これが今回の主題です。

公式の表現は「1.0〜1.35倍」と控えめ。

実測は1.46倍。

このギャップをどう読むかで、Pro $20の人とAPI従量の人とで取るべき行動が変わってきます。

順に整理します。

Claude Opus 4.7の「実質値上げ」はどこから来るのか

Anthropicは2026年4月16日にClaude Opus 4.7をリリースしました。

料金表は動いていない。

入力$5／出力$25／100万トークンで、Opus 4.6の単価をそのまま引き継いでいます。

にもかかわらず請求額だけが上がる、という現象が起きている。

原因は新しいtokenizer。

Anthropic公式はこう書いている。

Claude Opus 4.7 uses a new tokenizer, contributing to its improved performance on a wide range of tasks. This new tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models (up to ~35% more, varying by content).

出典: Anthropic公式 What's new in Claude 4.7 / Breaking changes

「may use」「up to ~35% more」という言い回し。

歯切れが悪いですね。

要するに、同じテキストを入れてもトークンの数え方が変わったので、内容次第で最大35%ほど膨らむ、という説明です。

単価は動かしていないが、同じ仕事にぶつけるトークンの量が増える。

結果、請求額は上がる。

公式Tooltipの数字がこの話の分かりやすい裏付けになります。

Opus 4.6の1Mトークン枠は約75万語／約340万Unicode文字。

Opus 4.7の1Mトークン枠は約55.5万語／約250万Unicode文字（Anthropic公式モデル比較表Tooltip）。

同じ「1Mトークン」でも詰め込める語数が約26%減った、というのが事実ベースの話です。

私の見方では、ここが「値上げ告知ゼロで請求額だけ上がる」の正体。

公式「1.0〜1.35倍」とSimon Willison実測「1.46倍」のギャップ

ここが記事の芯。

Anthropic公式は「最大1.35倍」と書いている。

Simon Willisonは実測で1.46倍を出している。

数字は寄っているようで、ちゃんとズレています。

Willisonの計測はAnthropic公式のトークンカウントAPIを叩いて、Opus 4.6と4.7の両方でトークン数を比較する自作ツールでやっている。

Claude Token Counterはソース公開済みで、同じ数字を誰でも再現できる形になっています。

測定テキストも、使い捨ての小細工ではなく「Opus 4.7のシステムプロンプト本文」を素材にしている。

実測値をまとめるとこうなります。

素材	Opus 4.6	Opus 4.7	倍率
英語システムプロンプト本文	5,039トークン	7,335トークン	1.46倍
高解像度PNG（3,456×2,234px／3.7MB）	1,578トークン	4,744トークン	3.01倍
低解像度PNG（682×318px）	310トークン	314トークン	1.01倍
テキスト重点PDF（15MB／30ページ）	56,482トークン	60,934トークン	1.08倍

出典: Simon Willison, Claude Token Counter, now with model comparisons (2026-04-20)

Willison本人のコメントがまた冷静。

per-token単価は変わらないが、同じテキストで約40%高くなる見込み、と淡々と書いている。

煽らない。

煽らないのに数字だけで効きます。

もう一つ、言語別の差を無視すると記事が嘘になる。

開発者が公開しているTokenomicsリーダーボードによれば、日本語・中国語・韓国語・絵文字は1.005〜1.07倍。

英語とコードは1.20〜1.47倍。

全入力の平均で38.6%増。

英語メイン・コード中心のユーザーだけが1.4倍級を食らい、日本語メインの人は影響がかなり小さい、というのが正確な姿です（GIGAZINEでも同ツールの結果が紹介されている）。

つまりSimon Willisonの1.46倍は「英語システムプロンプトという最も影響を受けやすい条件での数字」。

公式の「1.0〜1.35倍」は「幅広いコンテンツをならした範囲」。

両方とも嘘は言っていません。

ただ、API大口・コーディングエージェント運用のように英語プロンプトが常時走っている使い方では、公式レンジの上を超えて1.4倍級まで振れる。

私の見立てでは、ここが今回の「実質値上げ」の正体です。

Pro $20／Max $100／API従量、それぞれへの影響は？

同じ「1.46倍」の話でも、どのプランで使っているかで現金ダメージの出方はまるで別物。

ここを切り分けないと対策が空振ります。

プラン	月額	直接の料金増	体感ダメージ	主な影響
Claude Pro	$20	なし	中	5時間で約45メッセージの上限に早く達する
Claude Max 5x	$100	なし	中〜大	約225メッセージ／5時間。20%消費でSonnet 4.6に自動切替
Claude Max 20x	$200	なし	小〜中	約900メッセージ／5時間。50%消費でSonnet 4.6に自動切替
API従量	従量	あり	大	同じ仕事で請求額が最大1.46倍

5時間上限の具体数値出典: Zenken AI「Claude使用制限まとめ」（Anthropic公式発表ではなく、コミュニティ集計値を参照）。

料金はAnthropic公式。

Claude Pro $20ユーザー：料金は動かない。上限が早く枯れる

定額プランなので月$20は変わらない。

ただ5時間ローリングウィンドウのメッセージ上限（約45回）に、これまでより早く到達します。

Redditではリリース初日に3問で枯れたとの声も出ている。

体感での「値上げ」は確かにあります。

ただ請求書は動かない。

私ならここを分けて考えて、まず冷静になります。

Max $100／$200：Sonnet 4.6への自動切替で実害は限定的

Max 5xは20%消費、Max 20xは50%消費で自動的にSonnet 4.6に切り替わる仕様。

Sonnet 4.6は旧tokenizerのままなのでトークン肥大しない。

結果、Opus 4.7の消費増は「前半に集中して後半はSonnet」という形で部分的に吸収されます。

API従量：ここだけ現金ダメージが直撃

定額の盾がない。

同じ仕事で請求額がそのまま1.46倍になります。

Finoutのコスト試算によれば、コーディングエージェント（1M入力／200K出力／日）で月$300→$405（+$105／月、+35%）。

自律型SWEエージェント（10M入力／2M出力）で月$3,000→$4,050（Finout, The real cost story behind Claude Opus 4.7）。

さらに本番ワークロード（1億トークン／日）で1日$500→$675に跳ねた事例も報告されています（Startup Fortune）。

GitHub Copilotは4月末までOpus 4.7に7.5xのプレミアム倍率を適用していて、プラットフォーム側も負担を素通しせず、ユーザーに転嫁している。

「per-token据え置き」という公式メッセージと、請求書の現実は別物、というのがAPIユーザー側の肌感覚です。

※API従量 －使った分だけ請求される料金体系。

Pro／Maxの定額プランと違って、トークンが膨らめば膨らんだ分だけ請求額が上がる

※ローリングウィンドウ －「直近5時間で何回送ったか」を常に集計する方式。

リセットは固定時刻ではなく、5時間前の利用がスライドして外れていく

※SWEエージェント － Software Engineerの略。

コードのバグ修正や機能追加を自動で進めるAIのこと。

大量のコードを読み書きするので消費トークンが膨らみやすい

※プレミアム倍率 － GitHub Copilotなど一部プラットフォームで導入されている、上位モデルへのアクセス分を通常料金の何倍で消費するかの設定。

7.5xなら通常リクエスト7.5回分を1回で食う

値上げの代償としてOpus 4.7が得たもの

ここまで「実質値上げ」の側ばかり書いたので、対価側も1ブロックで整理しておきます。

Anthropic自身は「新tokenizerは性能向上に寄与している」と説明していて、ベンチマークは実際伸びています。

SWE-bench Verified: 43.7%（Opus 4.6の37.5%から向上、Anthropic公式）
SWE-bench Pro: 64.3%（同上）
CursorBench: 70%（Opus 4.6の58%から向上）
画像解像度上限: 2,576px／3.75MPに拡大（旧1,568px／1.15MPから約3.3倍）
新しいeffortレベルxhigh追加、1:1ピクセル座標マッピング対応
コンテキストウィンドウ1Mトークン（ただし語数換算では旧750k→新555k）

Y Combinator代表はOpenClawプロジェクトでOpus 4.7を採用中と表明していて、Cursorのデザイナーもプランニング用途で使い始めたとしています（dnyuz）。

性能面の評価は一定あります。

一方で、Hacker NewsのClaude 4.7 tokenizerスレッド（674ポイント／470コメント）では「Opus 4.7はpre-nerf版の4.6を新モデルとして化粧直ししただけで、tokenizer変更がstealth price increaseとして機能している」という指摘も出ています。

Redditの「serious regression」投稿は2,300アップボート。

Xでの「4.6より改善とは言えない」というポストには14,000いいねが付いている。

性能向上は事実、ただしコスト増と釣り合っているかは別論点、という空気です。

Opus 4.7の請求額を抑える3段階の使い分け

単純に「Opus 4.7を使うな」ではもったいない。

性能向上の実体もあるので、仕事の重みで使うモデルを変えるのが現実的な答えになります。

私が整理するとこうなる。

STEP1｜重要な難問だけOpus 4.7に回す

操作: Claude DesktopやAPI呼び出し時、モデル選択を明示する。

重い設計判断・複雑なリファクタ・長いエージェントタスクのときだけ claude-opus-4-7 を指定。

期待結果: per-token単価×1.46倍という二重課金を、難問の場面だけに局所化できる。

チャット全部をOpus 4.7にぶつけて月$405になっていた仕事を、難問だけに絞ると$200台前半に戻る計算（Finoutの試算ベース）。

詰まりどころ: 「常に最強モデル使えば安心」癖がある人ほど、ここで切り替える判断が遅れる。

AI総合研究所も「難問だけOpus 4.7、それ以外はSonnet／Haikuという使い分けで品質と単価の両立ができる」と整理している（AI総合研究所）。

私なら、まず1週間「Sonnetで足りなかった瞬間」を数えてみて、本当にOpus 4.7が要る回数を可視化します。

STEP2｜日常の会話・コーディングはSonnet 4.6に寄せる

操作: モデルを claude-sonnet-4-6 に切り替える。

Claude Codeの場合は /model sonnet コマンドで明示。

期待結果: Sonnet 4.6は旧tokenizerのままで、入力$3／出力$15／100万トークン。

Opus比で単価が40%安く、トークン肥大もない。

二重の意味で安い。

公式モデル一覧のTooltipでも「~750k words／~3.4M unicode characters」と明記されていて、Opus 4.7とのtokenizerの違いは明示されています。

詰まりどころ: Sonnetで品質が落ちると感じたら、その瞬間だけOpus 4.7に上げる運用。

Finoutの試算でも、同一キャッシュ条件のRAGワークロードでSonnet 4.6=月$392／Opus 4.7=月$652と、Sonnetが約40%安い。

日常タスクの受け皿はSonnetで確定です。

STEP3｜長文・大量データはHaiku 4.5で先に圧縮

操作: 議事録・大量PDF・ログなど、長い素材は先に claude-haiku-4-5 で要約させ、その圧縮結果だけをOpus 4.7に渡す2段構えにする。

期待結果: Haiku 4.5は旧tokenizer継承、入力$1／出力$5／100万トークン。

Opus 4.7の1/5の単価。

高い側（Opus 4.7）に流すトークン数自体を減らせる。

私の見方では、Opus 4.7のtokenizerに通すテキストをどれだけ絞れるかが、このtokenizer世代でのコスト最適化の本筋です。

詰まりどころ: Haikuでの圧縮ミスがOpus側に波及する。

プロンプト末尾に「事実関係を変えずに半分以下に要約」と明示し、要約結果は人が10秒だけ眺めてから流すと事故が減る。

補助策: 画像リサイズとToken Counterでの事前確認

画像は長辺1,500px前後にリサイズしてから送る（Simon Willison計測で高解像度PNGが3.01倍になる事実への直接の対抗策）
Claude Token Counterで送信前にOpus 4.6と4.7のトークン数を比較確認。公式APIベースなので誤差が少ない
Anthropic公式が推奨している通り、max_tokensパラメータにheadroomを持たせて、compaction triggerに余裕を足す
プロンプトキャッシュは最大90%オフ、バッチ処理は50%オフを使い倒す（Anthropic公式料金ページ）

Opus 4.7の料金運用で知っておきたい注意点

記事の角度が「実質値上げ」なので、反対側の注意もちゃんと置いておきます。

1.46倍は英語プロンプトという最も強く出る条件の数字。

日本語メインの使い方なら1.005〜1.07倍にとどまる可能性が高い。

翻訳・コード生成を大量に回すAPIユーザーほど影響が大きく、日本語チャットだけのPro定額ユーザーなら請求書は動かない。

私の判断では、英語コードベース側か日本語チャット側か、この線でこの記事から持ち帰る温度は変わります。

Anthropic公式の「1.0〜1.35倍」と実測「1.46倍」が乖離する理由も、結局は測定条件。

Anthropicは幅広いコンテンツをならしてのレンジ、Simon Willisonは英語システムプロンプトでの単点測定。

どちらも嘘ではない。

ただし英語コーディングエージェント用途では、公式レンジの外に飛ぶことが実測として確認された、という読み方が事実に近い。

SWE-benchのスコアにも注意が要ります。

Anthropic公式発表は43.7%（Verified）／64.3%（Pro）、第三者リーダーボードでは87.6%という数字も出回っているが、これはベンチマーク亜種（Verified／Pro／独自scaffold）の違いで、単純比較できない。

TokenMixとThe Next Webで数字が違って見えるのはこの事情です。

最後に。

5時間ローリングウィンドウの具体数値（Pro 45回／Max 5x 225回／Max 20x 900回）はAnthropic公式発表ではなく、ユーザーコミュニティの集計値をまとめたZenken AIの記事が出典。

公式は明確な数値を出していない。

読者側が「だいたいこのくらい」の当たりをつける目安として扱うのが適切です。

FAQ

Q1. 日本語ユーザーでも請求額は1.46倍になりますか？

なりません。

Tokenomicsの計測では日本語・中国語・韓国語・絵文字のトークン増加率は1.005〜1.07倍。

1.46倍という数字は英語システムプロンプトでの実測値で、英語・コード中心のユーザーに強く出る数字です。

日本語チャット中心のPro $20ユーザーは、トークン消費の観点では実質ほぼ影響がない水準。

Q2. Claude Pro $20プランの料金は上がりますか？

定額プランなので月額$20は変わりません。

ただし、Opus 4.7を使うと5時間ローリングウィンドウのメッセージ上限（約45回／5時間と集計されている）に早く到達します。

リリース初日に3問で上限に当たったとの報告も出ています（dnyuz, Claude-lash is here）。

請求書は動かないが体感は厳しくなる、という形。

Q3. Sonnet 4.6やHaiku 4.5も同じように値上げされていますか？

されていません。

Anthropic公式モデル一覧のTooltipで、Sonnet 4.6とHaiku 4.5のコンテキストは従来通り「~750k words／~3.4M unicode characters」と記載されており、tokenizerは旧方式のまま。

新tokenizerはOpus 4.7のみです。

日常タスクをSonnet／Haikuに寄せれば、tokenizer変更起因のコスト増は回避できます。

Q4. Opus 4.7の性能向上は値上げに見合っていますか？

用途次第。

SWE-bench Verified 43.7%（4.6は37.5%）、CursorBench 70%（4.6は58%）と、コード生成・エージェント用途での向上は公式に出ています。

ただしHacker News（674ポイント／470コメント）やReddit「serious regression」（2,300アップボート）のように「tokenizer変更がstealth price increaseとして機能している」との批判も根強い。

難問処理の速度・精度で元が取れる用途は見合う、日常チャット用途は見合いにくい、という分け方が現実的です。

Q5. API利用者はすぐに何を変えればいいですか？

まずClaude Token Counterで、手元の主要プロンプトがOpus 4.6→4.7でどの程度トークン膨らむかを実測すること。

その上で、重要タスクだけOpus 4.7、日常はSonnet 4.6、長文要約はHaiku 4.5で先に圧縮、の3段階に切り替える。

Anthropic公式はさらにmax_tokensのheadroomを広げる運用も推奨しています。

このページに出てきた言葉

tokenizer: 入力した文章をAIが処理できる単位（トークン）に分解するプログラム。同じ英文でも分け方が変われば消費トークン数が変わる。
トークン: AIの料金や処理量の計算単位。英語は単語の一部、日本語は数文字単位で1トークン。
per-token単価: 100万トークンあたりの料金。Opus 4.7は入力$5／出力$25でOpus 4.6から据え置き。
コンテキストウィンドウ: AIが一度に読み込める文章量の上限。Opus 4.7は1Mトークンだが、tokenizer変更で詰め込める語数は約26%減。
システムプロンプト: AIに性格やルールを覚えさせる前置き文。毎回送るのでここが膨らむと料金が直撃する。
API従量: 使った分だけ請求される料金体系。Pro／Maxの定額と違いトークン肥大が直接コストに跳ね返る。
SWEエージェント: Software Engineerの略。コード修正や機能追加を自動でこなすAI。長いコードと長いプロンプトを抱えるのでtokenizer変更の直撃を受ける。
プロンプトキャッシュ: 同じ前置きを再送する時に最大90%オフになる仕組み。長いシステムプロンプト運用で効く。
compaction trigger: 会話が長くなった時に過去のやり取りを自動で圧縮する起動条件。max_tokensのheadroomが狭いと早く発火して品質が落ちやすい。
stealth price increase: 「こっそり値上げ」。料金表は据え置きで、消費量側を増やすことで実質的に支払いを上げる手法を批判する語。

参考リンク

この記事を書いた人

aisola

Aisola Lab 運営者

AIツールを使ったコンテンツ制作・リサーチ・WordPress運用を日常的にやっています。自分で動かせるものは実際に触って書き、触っていないものは公式ドキュメントと一次情報をもとに書き分けています。

運営者情報 X（@ai_sola27）note

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-AI選び, Claude.ai

AI活用全般

2026/7/15

ChatGPT Sitesで家計簿・進捗ボードを作ってURLで配る手順｜サーバー契約もコードも不要

課金中のChatGPTに、プロンプトからWebサイトを作ってURLで配れる「ChatGPT Sites」が入り始めました。サーバー契約もコードも要らず、家計簿・進捗ボード・イベント案内級の小さいサイトを作って共有できるのが売りです。ただしパブリックベータで、容量やデータの保存地域など公式が数字を出していない部分もあります。この記事は課金中のChatGPTで小さなWebサイトを作って誰かに配りたい非エンジニア向け（HTMLを触ったことがなくても読めます）。 ChatGPT Sitesとは？プロンプトか ...

AI活用全般

2026/7/15

ChatGPTに絵コンテを頼むと文字の表しか出ない時｜GPT Image 2で12コマ・秒数つきの撮影設計図を画像1枚で出すプロンプト全文

ChatGPTに「絵コンテを作って」と頼むと、返ってくるのは文字だけの表がほとんどです。でも海外で拡散したあるプロンプトを貼ると、12コマ・秒数つきの撮影設計図が画像1枚で出てきます。 GPT Image 2なら無料プランでも試せて、書き換えるのは商品名の1箇所だけ。この記事は短尺動画を1人で撮っている非エンジニア向け（英語のプロンプトはコピペで大丈夫です）。そもそもこの「12コマ絵コンテ」プロンプトって何？ TikTokやInstagramの短尺動画を撮るとき、多くの人は段取りを頭の中だけで組みま ...

AI活用全般

2026/7/14

Gemini 3.5 Flashは本当に安いのか｜「Proより安い」の裏で前のFlashは3〜6倍値上げ、自分が損か得か見極める

Gemini 3.5 Flashは「3.1 Proより40%安い」も「前のFlashより3〜6倍高い」も、両方ほんとです。無料のGeminiアプリで使う人は前と同じ月額で性能アップ、APIで使う開発者は同じ処理で請求が跳ね上がる。同じモデルなのに損得が逆になります。飛びつく前に、手元の使い方が「無料アプリ側」か「API課金側」かだけは確認しといた方がいい。この記事はGeminiを業務で使い、ChatGPTやClaudeと使い分けているAPIコストが気になる人向け（モデルの料金とトークンの基本が分かれ ...

AI活用全般

2026/7/14

Perplexity ComputerがWord・Excel・Outlookに対応｜会社員の調べ物コピペ往復が消える（月20ドルProから）

WordやExcelの横で調べ物が完結する仕組みが、2026年5月29日に動き出しました。資料を別タブで調べてコピペで戻す、あの往復が消えるという話です。月20ドルのProプランから使えると、Perplexity公式が発表しました。この記事はWord・Excel・Outlookを毎日触る事務・営業・企画職の人向け（関数やプログラミングが分からなくても読めます）。 Perplexity Computerという調べ物AIが、Microsoftのオフィスソフトの中に入りました。Word、Excel、Pow ...

AI活用全般

2026/7/14

Gemini 3.5 Live Translateで旅行・接客・家族の会話を画面見せ合いなしで進める｜Google翻訳に無料で入った同時通訳

スマホの画面を相手に見せ合って、打ち込んで、また見せて。あのもどかしいやり取りが、会話のまま進むようになりました。 Gemini 3.5 Live Translate は、いつものGoogle翻訳アプリに無料で追加された同時通訳機能です。70以上の言語に対応し、サインアップも新アプリも要りません。ただし、契約や医療みたいに誤訳が命取りになる場面では、まだ人の通訳を残したほうがいい。旅行・接客・家族との会話で使い倒すのが、いまの正解だと私は思っています。この記事は英語が苦手で、海外旅行や外国人の接客に不 ...

Syncthing 4台運用レビュー｜Claude Code × WSLのコピペをゼロにした設計と.git除外の罠

Claude Codeで3Dフライトシムが2週間で動いた事例｜Three.js＋CesiumJS＋Google 3D Tilesで地形を作らない設計