Claude Code(Opus 4.6 / 4.7)で対話的に作業していて、コストより速度を優先したい場面がある人向け
テスト失敗127件を順番に直していく作業や、本番障害で原因切り分けを急ぐ場面など、待ち時間1秒を惜しんで extra usage の追加課金を払ってもいいときに、Claude Code の対話画面で <code>/fast</code> を叩いて有効化する。事前に Console で extra usage を有効化しておく必要がある。バッチ処理や夜間ジョブには向かない。
Claude Code で対話的に作業している時、返事の遅さに集中力を切らされた経験があるはずです。テストが100件単位で落ちていて1個ずつ直したい、ライブで挙動を追いながら原因を探したい、そういう瞬間にこの/fastは効きます。
同じOpus(Anthropicの主力モデル)を、速度を最優先するAPI構成で動かすトグルスイッチです。品質は変わりません。代わりに、お金が余計にかかります。
噛み砕くと
家電量販店で「特急配送便」だけ追加するイメージに近いです。中身の商品は変わらない、運び方を速い便に切り替えるだけ。その分、配送料は乗ります。
Opusという「中身」は同じまま、サーバーの動かし方を変えて返事を約2.5倍速くしています。文章の質、コード生成の精度、推論の深さ、ぜんぶ同じ。違うのは「待ち時間」と「請求額」だけです。
大事な前提:extra usage を有効化していないと /fast はそもそも起動しない
ここでつまずく人が一番多いです。fast mode はプラン外の追加課金枠(extra usage)に直接請求される仕組みなので、その枠が有効化されていないと /fast を叩いても動きません。個人アカウントは Claude Console の billing settings から有効化、Team/Enterprise の場合は組織の admin が組織レベルで有効化する必要があります。
有効化が済んでいれば、Pro/Max/Team/Enterprise(Claudeの月額プラン)に加入していても、fast mode で消費したトークンはプラン内枠から引かれません。最初の1トークンから extra usage に直接請求されます。月額20ドル払ってるんだから fast mode 使い放題、ではなく、fast mode は常に追加で財布から出ていくと覚えておく必要があります。
もう1つ、これは現時点での仕様の話です。fast mode は現在 research preview(試験提供)の段階で、価格・利用条件・提供形態は今後ユーザーからのフィードバックで変わる可能性があります。本記事の数字はあくまで2026-05-17時点のものとして読んでください。
「100件の失敗テストをサクサク直していく」を例に、実際の手順を見る
CIが赤くなって、テスト失敗が127件出ているとします。1個ずつ Claude Code に修正を相談していくのに、毎回20秒待たされたら集中が切れます。fast mode を入れて、待ち時間を約1/2.5に圧縮する流れを書きます。
ステップ1: バージョンを確認する
fast mode は v2.1.36 以降で使えます。Opus 4.7 で使う場合は v2.1.139 以降が必須です。古いバージョンだと /fast が反応しないか、Opus 4.7 だけ動きません。
$ claude --version
表示された番号がそれ以下なら、先に npm i -g @anthropic-ai/claude-code 等の手段でアップデートしておきます。
ステップ2: Opus 4.7 を使うなら設定値を入れる(2通り)
2026-05-14より前の時点では、/fast はデフォルトで Opus 4.6 上で動きます。最新の 4.7 を使いたい場合は、設定値を1つ追加します。書き方は2通りあって、用途で使い分けます。
方式A: その場限り(ターミナルで export)。今すぐ1回だけ試したい時はこれが速いです。
$ export CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE=1
$ claude
ただしこの方式は、ターミナルを閉じると設定値が消えます。次にターミナルを起動した時はまた export し直す必要があります。
方式B: 設定ファイルに書く(毎回有効)。今後ずっと 4.7 fast mode を使いたい場合はこちらが楽です。~/.claude/settings.json(ユーザー全体用)または プロジェクト直下の .claude/settings.json、組織で配布する managed settings ファイルのいずれかに、env キーで書き足します。
{
"env": {
"CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE": "1"
}
}
さらに、ユーザー設定ファイルに "fastMode": true を書いておくと、Claude Code 起動時から自動で fast mode がONになります。毎回 /fast を叩かなくて済みます。
{
"fastMode": true,
"env": {
"CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE": "1"
}
}
5月14日以降は 4.7 がデフォルトに切り替わる予定なので、それ以後は env の指定は不要になります。
ステップ3: Claude Code を起動して /fast を叩く
起動した対話画面で、まずトグルを ON にします。手入力でも、/f まで打って Tab キーを押すと /fast に補完されます。
> /fast
「Fast mode ON」のメッセージが出て、プロンプトの横に ↯(稲妻マーク)が点灯します。これが「いま速いほうで動いてますよ」のサイン。もう一度 /fast を叩くか、Tab キーを押すと on/off を切り替えできます。
ステップ4: 最初からONで叩く(途中ONはコスト的に損)
ここで初心者がやりがちな勘違いがあります。「最初は通常モードで会話を進めて、込み入った話だけ fast mode に切り替えればいい」と思いがちですが、これは逆に高くつきます。
セッション途中で fast mode をONにすると、それまでの会話の文脈ぜんぶに fast mode の料金($30/$150 MTok)が遡って適用されるからです。最初からONにする方が安く済みます。先ほどの settings ファイル方式("fastMode": true)で起動時ONにしておくと、この事故を構造的に防げます。
ステップ5: 127件のテスト失敗を順番に流し込む
あとはいつも通り、Claude Code に失敗ログを貼って原因と修正案を聞きます。返事が早いので、1件あたりの調査サイクル(読む → 質問する → 直す)が短くなります。通常30秒かかっていた応答が12〜15秒で返ってきます。
ステップ6: 区切りがついたら /fast でOFFに戻す
インタラクティブな作業が一段落したら、再度 /fast を叩いて OFF にします。↯ マークが消えれば標準モード。なお、OFFにしてもモデル自体は同じOpus版(4.6 or 4.7)に居続けます。元のモデル(SonnetやHaiku)に戻したい場合は別途 /model を叩く必要があります。
つまり /fast は何をしてくれるのか
- やってくれる: 同じ Opus(4.6 or 4.7)の応答速度を約2.5倍に上げる。品質は変わらない。再度叩けばOFF
- やってくれない: 安くする、品質を上げる、SonnetやHaikuを速くする、Bedrock/Vertex/Azure 経由で動かす
- 意味が薄い場面: バッチ処理・CI/CDの夜間ジョブ・1時間ぶん回しっぱなしの自律タスク(速度より総コストを気にする系)
使いどころ3シナリオ(具体題材で再現)
シナリオ1: リリース前夜にテスト失敗を量で潰すとき
金曜の夜、月曜リリース前の最終チェックでテスト127件が落ちている。1件ずつ Claude Code に原因を相談しながら直していく状況。応答1回あたり25秒 vs 10秒の差は、127件積み重なると約30分の節約になります。これは extra usage で数ドル追加払っても元が取れる場面です。
シナリオ2: 本番障害でログを読みながらライブで原因特定するとき
監視アラートが鳴って、Slack で「お客さんが繋がらない」と連絡が来た深夜2時。エラーログを Claude Code に貼って「これ何が起きてる?」を10秒で返してほしい場面。1秒でも早く原因切り分けしたい局面で、コストは後で考える、というケースで使います。
シナリオ3: ペアプロ感覚で会話のテンポを保ちたいとき
料理ブログの記事下書きを Claude と相談しながら書く、みたいな緩い作業でも、応答が15秒空くたびに気が散る人には効きます。ただこの用途は extra usage の請求が膨らみやすいので、月の請求書を見て「えっ」となる前に上限通知を Console で設定しておくのが安全です。
初心者が踏みやすい落とし穴
- 「fast mode = 軽量モデル」と思い込む。中身は同じ Opus です。性能は落ちません。落ちるのはコスト効率だけ
- extra usage を有効化せずに
/fastを叩く。Console の billing settings で有効化していないと、コマンド自体が起動しません。Team/Enterprise は admin に頼む必要があります - 月額プランに含まれてると勘違いする。Pro/Max でも、fast mode のトークンは extra usage に直接請求されます。最初の1トークンから課金
- Sonnet や Haiku で
/fastを叩く。Opus 4.6 か 4.7 でしか動きません。他モデル中に叩くと、Opus に強制スイッチします(つまり別途モデル変更が発生する) - Bedrock / Vertex / Azure 経由で使おうとする。これら third-party クラウド経由では使えません。Anthropic Console 直接、または Claude subscription プランのみ対応
- 会話の途中でONにする。それまでの文脈ぜんぶに fast mode 価格が遡及して請求されます。最初からONの方が安い
- effort level(思考の深さ調整)と混同する。fast mode は「速度↑コスト↑、品質は同じ」、effort level を下げるのは「思考時間↓速度↑、品質は落ちる可能性あり」。別もので、組み合わせ可能
- rate limit に当たって慌てる。fast mode の上限に達したり extra usage が枯れたりすると、自動で同じOpusの標準速度にフォールバックします。
↯マークが灰色になるだけで作業は続けられる。クールダウン明けで自動復帰 - research preview だから安心、と長期前提で予算を組む。価格・条件は今後変わる可能性ありと公式が明言しています。月予算を組む時は数字が動く前提で余裕をもたせるのが安全
書き方
/fast [on|off]
やってみるとこうなる
入力
/fast
出力例
Fast mode ON
プロンプト横に ↯ アイコンが点灯し、以降の応答が標準モードの約2.5倍速で返ってくる。料金は両モデルとも $30/$150 MTok(入力/出力)。
このページに出てきた言葉
- Opus
- Claudeシリーズの中で最も性能が高いモデル。コード生成や複雑な推論に強い。fast mode が動くのは 4.6 と 4.7 のみ
- トークン
- AIが文章を扱う最小単位。請求はこのトークン数で計算される(fast mode は $30/$150 MTok)
- extra usage
- 月額プランに含まれる無料枠を超えた分の追加課金枠。Console の billing settings で事前に有効化しないと fast mode 自体が起動しない
- research preview
- 本リリース前の試験提供段階。フィードバックを集めながら仕様や価格を調整するフェーズで、今後変更される可能性がある
- settings.json
- Claude Code の動作設定を書くファイル。env キーや fastMode キーを書いてセッション跨ぎで fast mode を有効にできる
- effort level
- Claude にどれくらい深く考えさせるかの設定。fast mode と混同されがちだが別物で、組み合わせも可能
- フォールバック
- fast mode の上限到達時に、自動で同じOpusの標準速度に切り替わる挙動。<code>↯</code> マークが灰色になる
- third-party クラウド
- Amazon Bedrock / Google Vertex AI / Microsoft Azure Foundry。これら経由では fast mode は使えない
- rate limit
- 一定時間内に使えるトークン量の上限。fast mode は Opus 4.6 と 4.7 で同じプールを共有する
- CLAUDE_CODE_ENABLE_OPUS_4_7_FAST_MODE
- Opus 4.7 で fast mode を動かすためにOSへ登録する設定値。<code>1</code> をセットして起動すると 4.7 に切り替わる(2026-05-14以降は不要、4.7 がデフォルト化予定)