AI活用全般

Claude原始人モード|トークン消費75%カットで使用制限が4倍もつ節約術

REVIEW
Claude原始人モード
トークン消費75%カットで使用制限が4倍もつ
トークン節約75%カットClaude Code

Claudeに「原始人みたいに喋って」と指示するだけで、トークン(AIが文章を処理する単位)の使用量が75%減ります。

同じ作業でも制限到達までの時間が約4倍に伸びます。

仕組みはClaudeの「丁寧すぎる出力」をカットするだけ。

通常180トークンかかるウェブ検索1回が、原始人モードだと45トークンで済みます。

この記事はClaudeの使用制限にすぐ引っかかる人、API経由でコストを下げたい人向け(Claudeを触ったことがあれば読めます)。

Claude原始人モード 評価まとめ

料金 無料(全プランで使える)
使いやすさ ★★★★★
日本語対応 ★★★★★
おすすめ度 ★★★★★

私の使い方: Claude Codeで長時間作業する時に、原始人モードをCLAUDE.md(プロジェクト固有の指示を書いておく設定ファイル)に仕込んでおきます。

あとは/compactで会話を圧縮、必要に応じてSonnetに切り替える3点セット。

これで1セッションの寿命がかなり延びました。

原始人モードはどういう仕組みか?

BEFORE:通常モード
「もちろんです!お手伝いさせていただきます。ウェブ検索ツールを実行いたしました」
📈約180トークン消費
AFTER:原始人モード
「Tool work」
📉約45トークン(75%カット)

Claudeに何か頼むと、めっちゃ丁寧に返ってきますよね。

「もちろんです!お手伝いさせていただきます。

ウェブ検索ツールを実行いたしましたので、以下の結果をご確認ください。

……長い。

こっちが欲しかったのは検索結果だけ。

「もちろんです」も「お手伝い」も「ご確認ください」もいらないわけです。

でもClaudeは親切なので、全部つけてきます。

この「親切」が、トークンを食ってるんですよ。

トークンというのは、AIが文章を処理する時の単位です。

ざっくり言うと、日本語だと1文字が1〜2トークンくらい。

英語だと1単語が1〜2トークンになります。

で、Claudeの使用制限はこのトークンの量で決まってるんです。

つまりClaudeが丁寧にしゃべればしゃべるほど、私の制限を食いつぶしていく。

比較項目 通常モード 原始人モード 削減率
ウェブ検索1回のトークン消費 約180トークン 約45トークン 75%カット
ツール実行報告の表現 「I executed the web search tool」(8トークン) 「Tool work」(2トークン) 75%カット
同じ制限枠でできる作業量 1倍(基準) 2〜4倍

これが10回、20回、100回と積み重なるとどうなるか。

同じ制限枠で2倍〜4倍の量の仕事ができるようになります。

これ正直やばい。

なぜChatGPTではなくClaudeで特に効くのか?

ここはちょっと面白い話です。

ChatGPTやGrokなど他のAIにも「短く喋って」と言えば短くなりますよね。

ただ、原始人モードがClaudeで特に効果的なのには理由があります。

Claudeは他のAIと比べて、めちゃくちゃ丁寧なんですよ。

これはAnthropic(Claudeを作っている会社)が意図的にそう作っています。

Anthropicは「安全なAI」を最重要視している会社で、Claudeには「ユーザーに対して誠実で、丁寧で、役に立つ存在であれ」という設計思想が根っこにあります。

だから「もちろんです!」「お手伝いします!」がデフォルトで入ってきます。

ChatGPTも丁寧な部類ですが、Claudeのほうが「報告」が長い傾向です。

特にツールを使った後の説明が丁寧すぎる感じ。

この「丁寧さのコスト」が、Claudeでは特に大きい。

だから原始人モードの効果も、Claudeで一番効くという話になります。

大事なのは、原始人モードはClaudeの喋り方を変えてるだけで、考え方は変わってないという点。

たとえば会社で超優秀な先輩がいるとします。

その先輩が毎回メールで「お疲れ様です。

先日ご依頼いただいた件について……」と書くタイプだったとして。

それを「結果だけ3行で教えてください」とお願いしたら? 先輩の能力は変わらないですよね。

調べてくれる内容も、判断の質も同じです。

報告がコンパクトになるだけ。

Claudeの原始人モードもこれと同じです。

Anthropicが「安全に丁寧に」と設計した部分を、ユーザー側から「でも今は結果だけでいい」と上書きしている。

設計思想は尊重しつつ、無駄な装飾だけ剥がす感じ。

Anthropic公式の見解としても「指示はClaudeの喋り方を変えるだけで、思考プロセスには影響しない」と確認されています。

この手法が広まるとどうなるか。

今まで「Claudeは制限がキツい」という理由でChatGPTに逃げてた人が、Claudeに戻ってくる流れが出てきます。

同じ月額で使える量が体感で2〜4倍になるわけなので。

Anthropicとしても、ユーザーが離れるよりは原始人モードで使い続けてくれたほうが嬉しいと思います。

そのうち公式で「省エネモード」みたいなのが実装される可能性は高いです。

原始人モードはどんな場面で使えるか?

💬
Claudeチャット
20往復の余計な挨拶カット
Pro枠内でやりとり回数が増える
💻
Claude Code
ツール報告が短縮
1セッションが長持ちする
API利用
出力75%減でコスト直結
Opus 25ドル→約6ドルに

Claudeチャットで何回もやりとりする時

リサーチやアイデア出しなど。

1回のやりとりは短くても、20往復もすると一気にトークンが溜まります。

毎回「もちろんです!」がつくのとつかないので、20回分の差はかなりでかい。

Proプランだと5時間で約45回のOpus(一番賢いモデル)メッセージが目安です。

原始人モードでClaudeの返答を短くすれば、同じ枠内でもっとやりとりできるようになります。

Claude Codeで長時間作業する時

Claude Codeは、ファイル読んだり、ツール使ったり、結果を報告したりで、トークンがめっちゃ飛ぶ仕組みです。

Anthropic公式データだと、平均で1日6ドル(約900円)くらい使うとされています。

私もClaude Codeをガッツリ使う日は、半日で制限に引っかかることがあります。

原始人モードにすると、ツール実行の報告とか中間説明が全部短くなるので、同じセッションがかなり長持ちします。

APIでClaudeを呼び出してる人は直接お金が減る

API(Application Programming Interface、手元のアプリやツールからClaudeを呼び出す仕組み)経由だとトークン量=そのままお金になります。

実はClaude Codeを使っている人は、裏側でこのAPIを使っているんですよ。

だから節約効果がダイレクトに財布に来ます。

Opusだと、出力100万トークンで25ドル(約3,750円)。

75%カットできたら、同じ仕事を6ドルちょっとでできる計算です。

APIの細かい設定が分からなくても大丈夫。

Claude Codeに「APIのコストを確認して」と聞けば、今のセッションでいくら使ったか教えてくれます。

原始人モードに必要なものは?

特別なツールは何もいりません。

Claudeのアカウントがあれば、無料プランでも使えます。

Claude(チャット版)でもClaude Codeでも、どっちでもOK。

やることは「プロンプト(Claudeへの指示文)を送るだけ」です。

原始人モードはどうやって設定するか?(3ステップ)

STEP 1
プロンプトを送る
「Me talk short. No explain. Just do.」
STEP 2
普通に指示する
いつも通り使うだけ
STEP 3
カスタマイズ
Max 3 sentences等を追加

ステップ1:最初にこのプロンプトを送る

Claudeとの会話の一番最初に、こう送ります。

英語のほうが効きがいいので、そのままコピペで大丈夫です。

「Me talk short. No explain. Tool first. Result first. No filler. No polite. Just do.」

日本語に訳すと「短く喋れ。

説明するな。

ツールが先。

結果が先。

余計な言葉なし。

丁寧語なし。

やるだけ。

」になります。

めっちゃ原始人っぽい。

主語もあやしいし、文法もめちゃくちゃ。

でも、これが効くんです。

期待結果: 送信直後にClaudeが「Got it. Short. No filler.」のような短い返答を返してきます。

普段の「承知しました!それでは〜」が消えていれば成功。

詰まりどころ: 日本語と英語を混ぜて送ると効きが弱くなることがあります。

最初の1通は英語だけで送るのがコツ。

ステップ2:普通に指示を出す

あとはいつも通り使うだけです。

「○○を調べて」「○○のコードを書いて」「○○をまとめて」。

Claudeの返答が、ガッツリ短くなります。

「もちろんです!」が消えてる。

「以下にまとめました」が消えてる。

結果だけ、ポンと出てくる。

期待結果: 通常モードで5〜6行の前置きが入っていた返答が、いきなり結論や検索結果から始まるようになります。

詰まりどころ: 途中で「もう少し丁寧に説明して」と指示すると、原始人モードが解除されることがあります。

その時は最初のプロンプトをもう一度送り直してください。

ステップ3:もっとカスタマイズしたい人向け

基本のプロンプトだけでも十分です。

ただ、もうちょっと細かく指定したい人は、こういうのも追加できます。

「Max 3 sentences per response.」(1回の返答は最大3文まで)

「Code only, no comments.」(コードだけ。コメントなし)

「Skip intro and summary.」(前置きとまとめを省略)

使い方に合わせて、足したり引いたりしてみてください。

私はClaude Codeでは「Code only, no comments.」を入れることが多いです。

期待結果: 1文ずつ確認しながら追加していくと、自分好みの「短さ」に調整できます。

Claude Codeで使う場合

Claude Codeだと、CLAUDE.mdという設定ファイルに書いておけます。

プロジェクトのフォルダに「CLAUDE.md」というファイルを作って、中にさっきのプロンプトを書くだけ。

そうすると、そのプロジェクトでClaude Codeを使うたびに自動で原始人モードになります。

毎回手打ちしなくていいので楽。

CLAUDE.mdの作り方が分からない人は、Claude Codeに「CLAUDE.mdファイルを作って、原始人モードの設定を入れて」と頼めばやってくれます。

よくある疑問

Q. 返答が短くなりすぎて、必要な情報まで省略されない?

されることもあります。

そういう時は「もう少し詳しく」と追加で聞けばOK。

最初から全部詳しく出すより、「短い返答→必要な部分だけ深掘り」のほうがトータルのトークンは少なくなります。

必要なところだけ掘る。

これが一番効率いい。

Q. 日本語で「短く喋って」じゃダメなの?

日本語でも効きます。

ただ、英語のほうがトークン効率がいいんですよ。

日本語の「短く喋ってください」は約15トークン。

英語の「Me talk short」は3トークン。

指示自体のトークンも節約できるので、英語がおすすめです。

Claudeは英語で指示しても日本語で返してくれるので、心配いりません。

Q. 原始人モードにしたら、Claudeが雑な回答になったりしない?

ならないです。

変わるのは「喋り方」だけ。

コードの品質も、検索の精度も、分析の深さも同じです。

ただし、Claudeの思考プロセス(Extended Thinking、Claudeが回答前に内部で考える機能)はトークンを使います。

原始人モードで節約できるのは「出力トークン」、つまりClaudeが表に出す言葉の部分。

内部で考えてる部分は変わらないので、考える力は保たれたまま、表現だけ圧縮される感じ。

Q. どのプランで一番効果がある?

どのプランでも効果はありますが、一番「ありがたみ」を感じるのはProプラン(月20ドル)の人だと思います。

Proだと5時間でOpus約45回、Sonnet(Opusより安くて速いモデル)約225回が目安。

ここが上限なので、1回あたりのトークン消費を減らせば、もっと多くのやりとりができます。

Maxプラン(月100ドル/200ドル)の人も、最近「制限が早すぎる」という声がかなり出てる。

Anthropicも「想定より早く制限に達してる」と認めているくらいなので、プランに関係なくやっておいて損はないです。

原始人モードの注意点と限界は?

出力トークンだけ節約:入力トークン(長い文章やファイルの読み込み)は減らない
ツール多用時は効果限定:ツール呼び出し自体のトークンが大きく、75%カットとまではいかない場合あり
文章作成時はOFF:レポートや記事を書かせる時は通常モードに戻す
思考の質は変わらない:喋り方が変わるだけで、コード品質・分析の深さは同じ

万能ではないです。

まず、節約できるのは「出力トークン」だけ。

Claudeに長い文章を送ったり、大きなファイルを読ませたりする「入力トークン」は、原始人モードでは減りません。

Claude Codeの場合、ファイルの読み込みやツール定義など、入力側のトークンがかなりの割合を占めています。

Anthropic公式のテスト結果も紹介しておくと「エージェント(AIが自律的にツールを使って作業する仕組み)的な使い方、つまりツールを何回も呼ぶような作業では、ツールの呼び出し自体のトークンが大きくて、出力の短縮による節約はそこまで劇的じゃない」とのこと。

つまりチャットでの質問応答みたいな「Claudeの返答が長い」場面では効果大。

Claude Codeでの自動作業のように「ツール呼び出しが多い」場面では、効果はあるけど75%カットとまではいかない場合もあります。

あと、レポートや記事を書いてもらう時は原始人モードにしないでください。

短く喋れと指示してるのに、長い文章を頼むのは矛盾するので。

作業系は原始人モード、文章作成は通常モードという使い分けがベストです。

原始人モード + /compact の合わせ技でさらに節約できるか?

3つの節約コンボ
原始人モード:毎回の返答を短縮する(出力トークン75%カット)
/compact:会話全体を要約して圧縮する(コンテキスト削減)
モデル切替(/model):難しい判断はOpus、単純作業はSonnetに切り替え

私がよくやってるのが、原始人モード+「/compact」の組み合わせです。

Claude Codeで作業してると、会話が長くなるにつれてトークンがどんどん溜まります。

途中で「/compact」と打つと、それまでの会話を要約して圧縮してくれる。

これだけでコンテキスト(Claudeが覚えている会話の情報量)がかなりスリムになります。

原始人モードで毎回の返答を短くして、/compactで全体を圧縮する。

このコンボで、1セッションの寿命がかなり延びました。

Claudeチャットの場合も同じ考え方で、タスクが変わったら新しい会話を始めるのがおすすめ。

古い会話を引きずると、過去のやりとりが全部トークンとして積み重なるので。

あとはモデルの使い分けも地味に効きます。

Claude Codeだと「/model」コマンドで、作業の途中からSonnetに切り替えられる。

難しい設計判断はOpusで、単純な作業はSonnetで。

原始人モード+/compact+モデル切り替えの3つを組み合わせると、トークン節約の効果はかなり大きくなります。

私はこの3点セットで、半日で枯れていたセッションが1日もつようになりました。

まとめ

やることは、最初に英語で「Me talk short. No explain. Tool first. Result first. No filler. No polite. Just do.」と送るだけ。

Claudeの頭の良さはそのまま、余計な言葉だけが消える。

結果、同じ制限枠でもっと多くの仕事ができるようになります。

まずは次にClaudeを開いた時に、1回だけ試してみてください。

私はもう手放せない。

このページに出てきた言葉

トークン
AIが文章を処理する単位。日本語1文字=1〜2トークン、英語1単語=1〜2トークンが目安。
API
Application Programming Interfaceの略。手元のアプリやツールからClaudeなどのAIを呼び出す仕組み。
CLAUDE.md
Claude Codeで使う設定ファイル。プロジェクト固有の指示(口調・ルール・参照情報)を書いておくと、毎回自動で読み込まれる。
プロンプト
AIに送る指示文のこと。質問や命令の本体。
Opus / Sonnet
Claudeのモデル名。Opusが一番賢いがコスト高、Sonnetは安くて速い中堅モデル。
Extended Thinking
Claudeが回答する前に内部で考える機能。表に出ない思考プロセスでもトークンを消費する。
コンテキスト
AIが今の会話で覚えている情報量。長い会話を続けると膨らみ、性能や速度に影響する。
エージェント
AIが自律的にツールを使って作業する仕組み。Claude Codeはエージェント的な動きをする。

参考リンク

  • Anthropic公式 Claudeプラン一覧: https://www.anthropic.com/pricing
  • Claude Code 公式ドキュメント: https://docs.anthropic.com/en/docs/claude-code

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, , ,

← 戻る