Claude Opus 4.7で変えるべきはモデル名ではなく使い方。
リリースと同時に示された3つのワークフローシフトを、記事執筆・リサーチ・資料作成に持ち込む話です。
SWE-bench Verified 87.6%、画像は面積比で約3倍(長辺2,576px対応)、xhigh推論モードが追加。
ただし長文コンテキストでは弱点が出るとの第三者検証もあり、盲信は危険です。
トークン消費は1から1.35倍に増加。
レート上限は引き上げられましたが、Proプランは使い方を間違えると即枯れます。
この記事はClaude Code または Claude.ai を日常で使っている書き手・リサーチャー・資料担当者向け(モデル切り替えの基本が分かれば読めます)。
2026年4月16日、Anthropic社がClaude Opus 4.7を公開しました。
SWE-bench Verified 87.6%、画像解像度の大幅拡張、xhigh推論モードの追加。
数字だけ追えば「強化版」です。
ただ、私が3日触って分かったのは、Opus 4.7で本当に変えるべきはモデル名ではなく使い方の方でした。
ここが今回の本題。
リリース当日のメッセージは一貫していて、「1行ずつ指示するな、委任するエンジニアとして扱え」という方向。
つまり4.6までの使い方をそのまま持ち込むと、性能の半分も引き出せない。
私自身、最初の半日は完全にこの罠にハマりました。
この記事は、公開された方針を私が手で裏付けて、エンジニア以外の日常業務(記事執筆・リサーチ・資料作成)に翻訳した速報です。
スペック羅列はやりません。
そこは他に任せる。
Claude Opus 4.7とは何が変わったのか
Opus 4.7は2026年4月16日に公開された、Anthropic社の一般向け最上位モデルです。
Claude.ai(Web)、API、Bedrock、Vertex AI、Microsoft Foundry、Snowflake Cortexから使えます。
料金は入力5ドル/出力25ドル(100万トークンあたり)で、Opus 4.6から据え置き。
コンテキストは100万トークン、最大出力は12.8万トークン。
数字で見た変化は下表のとおり。
ただし後で触れますが、全部が上がったわけではないのがポイント。
ここを隠す記事が多いので、私は正直に出します。
| 項目 | Opus 4.6 | Opus 4.7 | 差分 |
|---|---|---|---|
| SWE-bench Verified | 80.8% | 87.6% | +6.8pt |
| SWE-bench Pro | 53.4% | 64.3% | +10.9pt |
| CursorBench | 58% | 70% | +12pt |
| VisualAcuity(XBOW) | 54.5% | 98.5% | +44pt |
| 画像解像度(長辺) | 1,568px(1.15MP) | 2,576px(3.75MP) | 面積比で約3倍 |
| MRCR(長文読解) | 第三者検証で後退の指摘あり | 長文では弱点 | |
| 料金(入力/出力) | 5ドル/25ドル | 5ドル/25ドル | 据え置き |
長文読解の後退は本当にデカい。
長文Q&Aを毎日回す用途の人は、ここで戦力外と判断していい話です。
なぜ使い方を変える必要があるのか
リリース当日に出された方針はシンプルでした。
「1行ずつガイドする相棒プログラマーではなく、タスクを委任するエンジニアとして扱え」。
この一文がすべて。
さらに「4.7はより自律的で、より精密で、長時間タスクが上手くなった。
会話セッションを跨いで文脈を持ち越し、曖昧な指示もずっと上手く処理する」という方向性も同時に示されています。
正直、この「自律性」を信じて投げられるかどうかで体感が2倍違う。
私は最初、4.6の癖で「まず構成だけ見せて」「コメントだけ先に書いて」と段階チェックを挟んでいました。
結果、途中で方針が揺れて手戻りばっかり。
信じて投げた方が速い。
これが今回の記事を書いた直接の理由です。
3つのワークフローシフトとは?
リリース時に示された3シフトを、エンジニア以外の業務に翻訳します。
原文はClaude Code(開発者向けコマンドラインツール)前提ですが、Claude.ai(ブラウザ)で記事執筆やリサーチをしている人にもそのまま効く話です。
シフト1:相棒型から委任型へ
1行ずつ指示を出す「相棒型」をやめて、タスク全体を渡す「委任型」に切り替える。
4.6までの癖で一番残りやすいのがこれ。
私も最初は同じでした。
具体例。記事執筆の場合、昔はこう投げていました。
「まずAIツール比較記事の構成を見せて」→(確認)→「では導入を書いて」→(確認)→「次は比較表」→(確認)→…
4.7ではこれが逆効果。
中間確認でモデルのリズムが切れます。
いま私はこう投げています。
「AIツール比較記事を2,000字で書いて。
構成は導入・比較表・使い方・まとめ。
トーンは一人称『私』ベースで実体験混ぜる。
避ける表現は教科書定型と冒頭の前置き宣言。
対象ツールは○○と△△、評価軸は料金・使い勝手・拡張性の3つ」
ゴールと制約を最初のやり取りに全部込みで投げる。
これが効きます。
1発で8割くらい完成品が出てくる。
私の体感では往復回数が半分です。
シフト2:ゴール・制約・受け入れ条件を最初に全部入れる
2つ目の方針は「ゴール・制約・受け入れ条件を最初に全部入れろ」。
中間確認で詰めるのをやめて、最初のターンに全部押し込む形に切り替えます。
リサーチで試した例。
先週、AI関連の業務系サービス比較リサーチを投げた時の指示はこんな感じ。
- ゴール: 日本市場で使える動画生成AI 5社の月額・機能・法人導入事例を表にまとめる
- 制約: 価格は2026年4月時点。出典URLは各行に明記。日本語公式サイトがあるものを優先
- 受け入れ条件: thead/tbody構造のHTMLテーブル。各社1行以上。事例が見つからない場合は「情報なし」と正直に書く
これを1発で投げて、昼休み明けに表が1本上がっていました。
AIに任せる仕事の速度、完全に変わります。
中間確認しない勇気、大事。
シフト3:検証方法を事前に教える
3つ目は「モデルに『どう検証するか』を事前に教える」。
テスト手順をプロジェクトメモ(claude.mdなど)に書き込んでおく、もしくは検証用スキルを用意しておく形です。
4.7はモデル側で自己検証する力が強化されている、というのが触っての実感です。
エンジニアには「テストの手順をclaude.mdに書いとけ」ですが、それ以外の人にはこう翻訳できます。
「完成の合格基準を事前に渡しておけ」。
これだけ。
記事執筆で私が使っている合格基準の例。
- 文字数は±10%以内
- h2見出しは質問文にする
- FAQは3問以上
- 教科書定型は使わない(「〜できます」に短縮)
- 出典URLは各引用に必ず付ける
これを指示に含めると、4.7はモデル側で最後に「ここ違反していないか」をチェックしてから返してきます。
4.6の時より自己検証が効く。
これ、地味だけど一番革命でした。
エンジニア以外が使う具体シーン(記事執筆・リサーチ・資料作成)
記事執筆:全部込み指示で1発発注
私はいま、記事1本を3往復以内で仕上げることを目標にしています。
初回に全制約を投げ、2回目で軽微な修正、3回目で最終整形。
4.6では5から7往復必要だったのが半分以下。
時間効率で言うと、1本あたり40分が15分になりました。
ポイントは「最初に全部入れる勇気」。
怖いんですよ、情報詰めすぎると発散するんじゃないかって。
でも4.7は逆で、情報が濃いほど安定します。
タスクの重さに応じて応答の長さを調整する設計になっている、というのが私の体感です。
リサーチ:朝投げて昼回収
並行リサーチが化けました。
私は朝9時に3タスクを別ウィンドウで同時投入。
昼休み明けに3本揃います。
内訳は「比較リサーチ」「業界ニュースまとめ」「競合記事の分析」のような独立タスク。
逐次処理だと半日かかっていた仕事が、12時前には片付きます。
この使い方、複数並列で動かす運用と相性が良い。
1ウィンドウに集中して逐次処理する癖、もう古い。
並列で動かさないと4.7の恩恵は半分しか出ません。
資料作成:高解像度スクショをそのまま渡す
画像解像度が上がった恩恵、一番出ているのが資料作成です。
画像の最大解像度は長辺2,576px/3.75MPに拡張されました(4.6は長辺1,568px/1.15MP)。
面積比で約3倍、ピクセル長辺比で約1.6倍。
この差が画面分析で効きます。
私はいま、Figmaの画面を高解像度でキャプチャしてそのまま投げてます。
4.6だと縮小されてテキストが潰れていたのが、4.7では細部まで読める。
座標もピクセル1対1対応になったので、「左上から300pxの位置のボタン」みたいな指示が通る。
スライドレイアウトの自己チェック精度も上がった、というのが私の使用感です。
UI画像を渡して設計提案を出す使い方も現実的な速度で回るようになりました。
私の手元では、ダッシュボード1画面を投げて改善案を3点返してもらうのに2〜3分。
会議前のたたき台作りで重宝しています。
やめるべき旧習慣は?
4.6までの使い方で、4.7では逆効果になる習慣を5つ挙げます。
私自身、最初の半日で全部やらかしました。
| やめる習慣 | 理由 |
|---|---|
| 1行ずつ指示を出す相棒方式 | リリース時の方針でも「相棒型ではなく委任型」と示されている。自己検証サイクルを中断させる |
| 先に構成だけ見せて→本文の段階チェック | 中間確認でモデルのリズムが崩れる。一発で全部投げる方が通る |
| 長会話を延々続ける | 履歴が肥大化。長時間の会話でトークン消費が膨らみやすい |
| max推論をデフォルトにする | 長時間タスクで過剰思考になりやすい。xhighで十分 |
| 4.6の指示文をそのまま流用する | プロンプトと環境設定の再チューニングが推奨されている。4.6で暗黙的に通っていたクセが4.7では外される |
特に「中間チェック癖」は、真面目に仕事する人ほど抜けにくい。
私も「ちゃんと確認しながら進める方が安全」と思っていた。
4.7ではそれが邪魔になる。
ここは意識して捨てる必要があります。
Opus 4.7運用で意識したい5つのコツ
私が3日触って整理した、4.7運用の5つのコツ。
3シフトと重なる部分もありますが、こちらは日々の小ワザに寄せた切り口です。
- Max契約者向けの自動運転モードを活用する
- 事前承認スキルで権限確認の手間を削る
- 長会話は途中で要約を取って継ぎ直す
- 中間作業を非表示にする運用に切り替える
- 推論強度は xhigh をデフォルトにして、詰まった時だけ max に上げる
5項目の方向性は「委任・詳細プラン・中間確認を減らす」で一貫しています。
私もこの運用に切り替えてから、max が必要な場面は週に2〜3回まで減りました。
注意点と限界(正直なデメリット)
長文読解は後退した
一番大事な注意点はここ。
第三者の検証記事による実測では、MRCR(長文コンテキスト理解)が大きく後退したという指摘が複数あります。
長尺のワークフロー文書を読ませると、読んだと答えながら内容と無関係な出力を返すという事例報告もあります。
このMRCR指標自体が「紛らわしい情報を積み重ねた特殊なテスト」で、実応用に近いのはGraphWalksの方だ、という反論もあります。
ただ、長文Q&Aや長文読解がメイン用途の人は、4.7を無条件で推奨できません。
コードや実作業の委任では上がったが、長文読解では下がった。
この使い分けは必須。
私の判断は明確。
記事執筆・リサーチ・コード書きは4.7、長文PDFをまるっと要約させるなら4.6残し。
用途で分ける。
トークン消費は増える
新しい区切り方で、同じ入力が最大1.35倍のトークン数になります。
コードや構造化データで特に高め。
「4.7はより多く考えるので、トークン消費は4.6より上がる」という方向性は最初から示されていました。
このため、全契約者のレート上限が引き上げられています。
ただ、Proプラン(月20ドル)で重い使い方をすると依然として枯れます。
私の体感だと、Max(月100ドル〜)以上じゃないと本格運用は厳しい。
正直ここがネック。
APIの破壊的変更
extended thinking budget(固定budget_tokens指定)はOpus 4.7で廃止。
そのまま投げると400エラーになります。
adaptive thinkingへの移行が必要。
temperature・top_p・top_kも非標準値を設定すると400エラー。
Claude APIユーザーは移行時に注意が必要です。
結局、Opus 4.7は使うべきか
私の結論。
Claude Code / 記事執筆 / リサーチ / 資料作成が主用途なら即切り替え、長文PDF読解がメインなら4.6残し、ライトユーザーはProだと枯れるのでMax検討。
これに尽きます。
ただ一番強く言いたいのは、冒頭の繰り返しになりますが、変えるべきはモデル名ではなく使い方ということ。
4.7に切り替えただけで4.6の指示文を流用しても、体感は「ちょっと良くなった」程度で終わる。
やり方を3シフトさせて初めて、数字どおりの飛躍が出てきます。
「任せる勇気」が要ります。
AIに投げて事故った経験がある人ほど、細かく確認したくなる。
その気持ちも分かる。
ただ4.7に関しては、その癖を一旦置いて「ゴール・制約・合格基準を全部最初に渡して、あとは任せる」という投げ方に切り替えた方が速いし精度も出る。
私はもう戻れないです。
FAQ
Q1. Opus 4.7はOpus 4.6の完全上位互換ですか?
いいえ。
SWE-benchや画像認識は大幅に向上しましたが、第三者の検証では長文読解(MRCR)で大きく後退したという指摘があります。
長文PDFの読解が主用途なら4.6を残した方が無難です。
Q2. Claude Proプランで使えますか?
使えますが、トークン消費が4.6より1から1.35倍に増えているため、本格運用だと使用上限に早く到達します。
本気で使うならMax(月100ドル〜)以上を検討した方がいいです。
私の場合、Proでは2〜3時間で枯れていました。
Q3. 料金は上がりましたか?
入力5ドル/出力25ドル(100万トークンあたり)で据え置きです。
ただし区切り方が変わって同じ入力でもトークン数が増えるため、実効コストは上がりえます。
プロンプトキャッシュやバッチ処理で50から90%のコスト削減ができるので、APIユーザーはここで調整します。
Q4. Mythosって何ですか?
Opus 4.7より上位の、セキュリティ用途の特定顧客向けモデルですが限定公開で、一般ユーザーは触れません。
一般向けの最上位はOpus 4.7です。
Mythosは一般記事では深追り不要です。
Q5. xhighとmax、どちらを使えばいいですか?
「ほとんどのタスクでxhigh、最難問でmax」という方向性が示されています。
max は長時間タスクで過剰思考しやすい、という注意もあるので、デフォルトはxhighで、詰まった時だけmaxに切り替えるのが推奨です。
私の運用ではxhighが9割、maxは週に1〜2回。
Q6. 4.6のプロンプトをそのまま使えますか?
使えますが、性能は引き出せません。
プロンプトと環境設定の再チューニングが推奨されています。
特に「先に構成を見せて」「1行ずつ確認しながら」系の中間チェック型は、4.7では逆効果になります。
このページに出てきた言葉
- SWE-bench Verified
- AIにソフトウェア開発の課題を解かせるベンチマーク。実用力の代表指標
- MRCR
- 長文の中で「あの人」「それ」が何を指すかを最後まで追えるかを測る長文読解ベンチマーク
- xhigh / max
- 推論にどれくらい時間とトークンをかけるかの強度設定。Opus 4.7では low / high / xhigh / max の4段階
- トークン
- AIが文章を扱うときの最小単位。日本語1文字が1〜3トークン程度。料金はこの個数で計算される
- コンテキスト
- AIが1回のやり取りで覚えていられる文章量の上限。100万トークン=日本語で約60〜70万字
- プロンプト
- AIに渡す指示文。何を、どんな条件で、どこまで書くかをまとめた依頼書
- claude.md
- プロジェクトのルートに置く設定メモ。Claude Codeが起動時に読む「このプロジェクトのお約束」
- API
- アプリ同士が情報をやり取りするための窓口。Claudeをコードから呼び出す方式
- rate limit
- 一定時間内に送れるリクエスト数・トークン数の上限。超えると一時的に使えなくなる
- extended thinking budget
- 「ここまで考えていい」という思考トークン数の上限を固定で指定する旧仕様。Opus 4.7では廃止
関連リンク
- Anthropic公式発表:Claude Opus 4.7
- 公式API docs:What's New in Opus 4.7
- 公式ベストプラクティス:Claude Opus 4.7 with Claude Code
- Anthropic公式:Claudeモデル全体仕様
- Anthropic公式:Claude Code ドキュメント
※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。