Claudeに「原始人みたいに喋って」と指示するだけで、
トークン使用量が75%減る。
同じ作業でも制限到達までの時間が約4倍に伸びる。
仕組みはシンプルで、
Claudeの「丁寧すぎる出力」をカットするだけ。
通常180トークンかかるウェブ検索1回が、
原始人モードだと45トークンで済む。
この記事では、
原始人モードの仕組み・設定方法・実際の節約効果を解説する。
Claudeの使用制限にすぐ引っかかる人、
API経由でコストを下げたい人向け。
私の使い方: Claude Codeで長時間作業する時に原始人モードをCLAUDE.mdに仕込んでおき、
/compactで会話を圧縮、
必要に応じてSonnetに切り替える3点セット。
これで1セッションの寿命がかなり延びた。
原始人モードはどういう仕組みか?
そもそもなんですけど。
Claudeに何か頼むと、めっちゃ丁寧に返ってきますよね。
「もちろんです!お手伝いさせていただきます。
ウェブ検索ツールを実行いたしましたので、
以下の結果をご確認ください。
」
……長い。
やってほしかったのは検索結果だけなんですよ。
「もちろんです」も「お手伝い」も「ご確認ください」もいらない。
でもClaudeは親切だから、
全部つけてくる。
この「親切」が、トークンを食ってるんです。
トークンっていうのは、
AIが文章を処理する時の単位です。
ざっくり言うと、
日本語だと1文字が1〜2トークンくらい。
英語だと1単語が1〜2トークン。
で、
Claudeの使用制限って、
このトークンの量で決まってるんですよ。
つまり、
Claudeが丁寧にしゃべればしゃべるほど、
自分の制限を食いつぶしてる。
| 比較項目 | 通常モード | 原始人モード | 削減率 |
|---|---|---|---|
| ウェブ検索1回のトークン消費 | 約180トークン | 約45トークン | 75%カット |
| ツール実行報告の表現 | 「I executed the web search tool」(8トークン) | 「Tool work」(2トークン) | 75%カット |
| 同じ制限枠でできる作業量 | 1倍(基準) | 2〜4倍 | — |
これが10回、
20回、
100回と積み重なると? 同じ制限枠で、
2倍〜4倍の量の仕事ができるようになるんです。
なぜChatGPTではなくClaudeで特に効くのか?
ここ、
ちょっと面白い話なんですけど。
ChatGPTとかGrokとか、
他のAIにも「短く喋って」って言えば短くなりますよね。
でも原始人モードがClaudeで特に効果的なのには理由がある。
Claudeって、
他のAIと比べてめちゃくちゃ丁寧なんですよ。
これ、
Anthropicが意図的にそう作ってるんです。
Anthropicって「安全なAI」を最重要視してる会社で、
Claudeには「ユーザーに対して誠実で、
丁寧で、
役に立つ存在であれ」っていう設計思想が根っこにある。
だから「もちろんです!」「お手伝いします!」がデフォルトで入ってくる。
ChatGPTも丁寧だけど、
Claudeのほうが「報告」が長い傾向がある。
特にツールを使った後の説明が丁寧すぎるんですよね。
この「丁寧さのコスト」が、
Claudeでは特に大きい。
だから原始人モードの効果も、
Claudeで一番効くっていう話なんです。
で、
大事なのは。
原始人モードって、
Claudeの喋り方を変えてるだけなんですよ。
考え方は変わってない。
たとえて言うと、
会社で超優秀な先輩がいるとして。
その先輩が毎回メールで「お疲れ様です。
先日ご依頼いただいた件について……」って書くタイプだったとする。
それを「結果だけ3行で教えてください」ってお願いしたら? 先輩の能力は変わらないですよね。
調べてくれる内容も、
判断の質も同じ。
ただ報告がコンパクトになるだけ。
Claudeの原始人モードも全く同じです。
Anthropicが「安全に丁寧に」と設計した部分を、
ユーザー側から「でも今は結果だけでいい」って上書きしてる。
設計思想は尊重しつつ、
無駄な装飾だけ剥がす。
Anthropicの社員も確認していて、
「指示はClaudeの喋り方を変えるだけで、
思考プロセスには影響しない」とコメントしている。
この手法が広まるとどうなるか。
今まで「Claudeは制限がキツい」って理由でChatGPTに逃げてた人が、
Claudeに戻ってくる流れが出てきます。
同じ月額で使える量が体感で2〜4倍になるわけですからね。
Anthropicとしても、
ユーザーが離れるよりは原始人モードで使い続けてくれたほうがいいはず。
そのうち、
公式で「省エネモード」みたいなのが実装される可能性は高いです。
原始人モードはどんな場面で使えるか?
Claudeチャットで何回もやりとりする時
リサーチとか、
アイデア出しとか。
1回のやりとりは短くても、
20往復とかすると一気にトークンが溜まる。
毎回「もちろんです!」がつくのとつかないの、
20回分の差はでかいです。
Proプランだと5時間で約45回のOpusメッセージが目安。
原始人モードでClaudeの返答を短くすれば、
同じ枠内でもっとやりとりできます。
Claude Codeで長時間作業する時
Claude Codeって、
ファイル読んだり、
ツール使ったり、
結果を報告したりで、
トークンがめっちゃ飛ぶんですよ。
Anthropicの公式データだと、
平均で1日6ドル(約900円)くらい使う。
自分もClaude Codeをガッツリ使う日は、
半日で制限に引っかかることがあって。
原始人モードにすると、
ツール実行の報告とか中間説明が全部短くなるので、
同じセッションがかなり長持ちします。
APIでClaudeを呼び出してる人は直接お金が減る
APIっていうのは、
自分のアプリやツールからClaudeを呼び出す仕組みです。
実はClaude Codeを使ってる人は、
裏側でAPIを使ってるんですよ。
API経由だとトークン量=そのままお金なので、
節約効果がダイレクトに財布に来る。
Opus(一番賢いモデル)だと、
出力100万トークンで25ドル(約3,750円)。
75%カットできたら、
同じ仕事を6ドルちょっとでできる計算です。
APIの詳しい設定がわからなくても大丈夫。
Claude Codeに「APIのコストを確認して」って聞けば、
今のセッションでいくら使ったか教えてくれます。
原始人モードに必要なものは?
特別なツールは何もいりません。
Claudeのアカウントがあれば、
無料プランでも使えます。
Claude(チャット)でもClaude Codeでも、
どっちでもOK。
やることは「プロンプト(指示文)を送るだけ」です。
原始人モードはどうやって設定するか?(3ステップ)
ステップ1:最初にこのプロンプトを送る
Claudeとの会話の一番最初に、
こう送ってください。
英語のほうが効きがいいので、
そのままコピペで大丈夫です。
「Me talk short. No explain. Tool first. Result first. No filler. No polite. Just do.」
日本語に訳すと「短く喋れ。
説明するな。
ツールが先。
結果が先。
余計な言葉なし。
丁寧語なし。
やるだけ。
」
原始人っぽいですよね。
主語もあやしいし、
文法もめちゃくちゃ。
でも、
これが効くんです。
ステップ2:普通に指示を出す
あとはいつも通り使うだけ。
「○○を調べて」「○○のコードを書いて」「○○をまとめて」。
Claudeの返答が、
ガッツリ短くなってるはずです。
「もちろんです!」が消えてる。
「以下にまとめました」が消えてる。
結果だけ、
ポンと出てくる。
ステップ3:もっとカスタマイズしたい人向け
基本のプロンプトだけでも十分なんですけど。
もうちょっと細かく指定したい人は、
こういうのも追加できます。
「Max 3 sentences per response.」(1回の返答は最大3文まで)
「Code only, no comments.」(コードだけ。コメントなし)
「Skip intro and summary.」(前置きとまとめを省略)
自分の使い方に合わせて、足したり引いたりしてみてください。
Claude Codeで使う場合
Claude Codeだと、
CLAUDE.mdっていう設定ファイルに書いておけます。
プロジェクトのフォルダに「CLAUDE.md」ってファイルを作って、
中にさっきのプロンプトを書くだけ。
そうすると、
そのプロジェクトでClaude Codeを使うたびに自動で原始人モードになります。
毎回手打ちしなくていいので楽です。
CLAUDE.mdの作り方がわからない人は、
Claude Codeに「CLAUDE.mdファイルを作って、
原始人モードの設定を入れて」って頼めばやってくれます。
よくある疑問
Q. 返答が短くなりすぎて、必要な情報まで省略されない?
されることもあります。
そういう時は「もう少し詳しく」って追加で聞けばOKです。
最初から全部詳しく出すより、
「短い返答→必要な部分だけ深掘り」のほうがトータルのトークンは少なくなります。
必要なところだけ掘る。
これが一番効率いい。
Q. 日本語で「短く喋って」じゃダメなの?
日本語でも効きます。
ただ、
英語のほうがトークン効率がいいんですよ。
日本語の「短く喋ってください」は約15トークン。
英語の「Me talk short」は3トークン。
指示自体のトークンも節約できるので、
英語がおすすめです。
Claudeは英語で指示しても日本語で返してくれるので、
心配いりません。
Q. 原始人モードにしたら、Claudeが雑な回答になったりしない?
ならないです。
変わるのは「喋り方」だけ。
コードの品質も、
検索の精度も、
分析の深さも同じです。
ただし、
Claudeの思考プロセス(Extended Thinking)はトークンを使います。
原始人モードで節約できるのは「出力トークン」、
つまりClaudeが表に出す言葉の部分。
内部で考えてる部分は変わらないので、
考える力は保たれたまま、
表現だけ圧縮される感じです。
Q. どのプランで一番効果がある?
どのプランでも効果はあるんですけど。
一番「ありがたみ」を感じるのは、
Proプラン(月20ドル)の人だと思います。
Proだと5時間でOpus約45回、
Sonnet約225回が目安。
ここが上限なので、
1回あたりのトークン消費を減らせば、
もっと多くのやりとりができる。
Maxプラン(月100ドル/200ドル)の人も、
最近「制限が早すぎる」って声がかなり出てる。
Anthropicも「想定より早く制限に達してる」って認めてるくらいなので。
プランに関係なく、
やっておいて損はないです。
原始人モードの注意点と限界は?
正直に言うと、万能ではないです。
まず、
節約できるのは「出力トークン」だけ。
Claudeに長い文章を送ったり、
大きなファイルを読ませたりする「入力トークン」は、
原始人モードでは減りません。
Claude Codeの場合、
ファイルの読み込みとかツール定義とか、
入力側のトークンがかなりの割合を占めてます。
Anthropicの社員が実際にテストした結果も紹介しておくと。
「エージェント的な使い方(ツールを何回も呼ぶような作業)だと、
ツールの呼び出し自体のトークンが大きくて、
出力の短縮による節約はそこまで劇的じゃない」とのこと。
つまり、
チャットでの質問応答みたいな「Claudeの返答が長い」場面では効果大。
Claude Codeでの自動作業みたいな「ツール呼び出しが多い」場面では、
効果はあるけど75%カットとまではいかない場合があります。
あと、
レポートや記事を書いてもらう時は原始人モードにしないでください。
短く喋れって指示してるのに、
長い文章を頼むのは矛盾するので。
作業系は原始人モード、
文章作成は通常モードって使い分けるのがベストです。
原始人モード + /compact の合わせ技でさらに節約できるか?
自分がよくやってるのが、原始人モード+「/compact」の組み合わせです。
Claude Codeで作業してると、
会話が長くなるにつれてトークンがどんどん溜まるんですよ。
で、
途中で「/compact」って打つと、
それまでの会話を要約して圧縮してくれる。
これだけでコンテキスト(Claudeが覚えてる情報量)がかなりスリムになります。
原始人モードで毎回の返答を短くして、
/compactで全体を圧縮する。
このコンボで、
1セッションの寿命がかなり延びました。
Claudeチャットの場合も同じ考え方で、
タスクが変わったら新しい会話を始めるのがおすすめ。
古い会話を引きずると、
過去のやりとりが全部トークンとして積み重なるので。
あとは、
モデルの使い分けも地味に効きます。
Claude Codeだと「/model」コマンドで、
作業の途中からSonnet(安くて速いモデル)に切り替えられる。
難しい設計判断はOpusで、
単純な作業はSonnetで。
原始人モード+/compact+モデル切り替えの3つを組み合わせると、
トークン節約の効果はかなり大きくなります。
まとめ
やることは、
最初に英語で「Me talk short. No explain. Tool first. Result first. No filler. No polite. Just do.」って送るだけ。
Claudeの頭の良さはそのまま、
余計な言葉だけが消える。
結果、
同じ制限枠でもっと多くの仕事ができるようになる。
まずは次にClaudeを開いた時に、1回だけ試してみてください。
参考リンク
- Anthropic公式 Claudeプラン一覧: https://www.anthropic.com/pricing
- Claude Code 公式ドキュメント: https://docs.anthropic.com/en/docs/claude-code
※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。